[Pandas] notna,notnull

반응형
    반응형

    notna와 notnull을 이용하여 결측치가 아닌 값을 찾는 방법입니다.

    isin이나 isna로 하는 게 더 편하긴 하지만 쓰기 나름이라서 누군가는 필요할 수도 있으니 일단 포스팅을 하겠습니다.

     

    예제로 데이터프레임을 하나 만들겠습니다.

     

    df = pd.DataFrame(dict(level=[1,2,3,4,5,np.nan],age=[12,13,18,20,np.nan,23]))
    df

     

    notna 와 notnull 의 기능

    notna 와 notnull 은 isna와 반대로 결측치가 아닌 값을 찾아내는 기능을 가지고 있습니다.

    그래서 bool로 출력이 되는데 결측치에는 False로 나오게 됩니다.

     

    df_notna = pd.notna(df)
    df_notna

     

    df_notnull = pd.notnull(df)
    df_notnull

     

    notna, notnull의 기능이 똑같으니 아무거나 써도 상관은 없습니다.

    isna와 정반대의 True,False가 나옵니다.

    사실 결측치를 없애는 게 목적이라면 isna나 notna 보다는 dropna를 쓰면 되서 큰 의미는 없습니다. 

     

    대량의 데이터에서 어디에 결측치가 있는지 알아볼 때 쓰는 것이라서

    자신의 기호에 맞게 isna나 notna를 쓰면 되지 않을까 싶습니다.

     

     

    관련 포스팅

    [Python/Pandas] - [Pandas] DataFrame 결측치(NaN) 처리

     

    댓글

    Designed by JB FACTORY

    ....