Pandas로 xlsx 안 열어질 때

반응형
    반응형

     

    다들 그러는지 잘 모르겠지만 저는.. 단순하게 pandas.read_excel으로 xlsx를 불러오면 다음과 같은 오류가 뜹니다.

    import pandas as pd
    pd.read_excel('./area.xlsx')

     

     

    그래서 방법을 찾다 알게 된 것이 engine을 바꾸면 된다해서 한 번 바꿔봤습니다.

    xlrd 가 업데이트 되면서 xlsx 지원을 하지 않는다고 하니 판다스의 기본 engine이 xlrd로 설정되어 있나봅니다.

    이유가 분명해서 그런지 생각보다 간단히 해결이 되었습니다. 그냥 engine을 openpyxl로 바꾸면 됩니다. 

    먼저 openpyxl 모듈이 설치되어 있어야 합니다.

    설치가 안 되있다면 다음과 같이 입력해 설치를 합시다.(주피터가 아닐경우 !는 빼야 실행이 됩니다)

    !pip install openpyxl

     

    설치가 다 되었으면 engine을 바꿔보겠습니다.

    import pandas as pd
    df = pd.read_excel('./area.xlsx',engine='openpyxl')
    df.head()

     

     

    아주 잘 되네요~!

    댓글

    Designed by JB FACTORY

    ....