[Pandas] 엑셀 불러오기 전에 시트네임부터 확인하기

반응형
    반응형

    판다스 시트네임 확인하기

    빅데이터로 넘어가면 엑셀이나 csv 파일을 불러와서 뭔가 하기가 꺼려집니다. 너무 방대하거든요.
    특히, 일부 데이터만 필요한 경우, 다 불러올 필요가 없는 경우나 read_excel이나 read_csv를 사용하면 디폴트로 첫번째 시트만 불러와지기 때문에 다른 시트를 가져오려면 해당 시트 네임을 알아야 합니다.

    파이썬으로 시트 네임만 가져오는 방법을 알려드립니다.


    먼저, ExcelFile()을 이용해 엑셀 객체를 만들어줍니다.

    import pandas as pd  
    
    # Excel 파일 경로 
    file_path = 'your_excel_file.xlsx' 
    
    # Excel 파일 객체 생성 
    excel_file = pd.ExcelFile(file_path)  

     

    sheet_names를 이용해 시트 확인을 합니다.

    # 파일에 있는 시트 이름들 확인 
    sheet_names = excel_file.sheet_names 
    print(sheet_names)  


    리스트 형식으로 시트네임이 나오게 됩니다.

    해당 시트네임이 sheet_names에 있다면 데이터프레임을 생성하는 코드를 만들어볼 수 있습니다.

    desired_sheet_name = 'Sheet1' 
    # 시트가 존재하면 데이터를 불러옴 
    if desired_sheet_name in sheet_names:     
        df = pd.read_excel(file_path, sheet_name=desired_sheet_name)     
        print(df)
    else:
        print(f'{desired_sheet_name}' does not exists.)

    마치며

    시트네임을 파이썬에서 바로 알 수 있고 리스트로 쓸 수 있어서 여러모로 편합니다.

     

    함께 보면 좋은 글

    [파이썬] xlsx 파일 csv로 변환하기

    [파이썬] 딕셔너리 합치기(key 같을 때 정리)

    [Pandas] 데이터프레임 문자열 조건 검색법 총정리

     

    댓글

    Designed by JB FACTORY

    ....