[Pandas] notna,notnull
- Python/Pandas
- 2021. 8. 14.
반응형
반응형
notna와 notnull을 이용하여 결측치가 아닌 값을 찾는 방법입니다.
isin이나 isna로 하는 게 더 편하긴 하지만 쓰기 나름이라서 누군가는 필요할 수도 있으니 일단 포스팅을 하겠습니다.
예제로 데이터프레임을 하나 만들겠습니다.
df = pd.DataFrame(dict(level=[1,2,3,4,5,np.nan],age=[12,13,18,20,np.nan,23]))
df
notna 와 notnull 의 기능
notna 와 notnull 은 isna와 반대로 결측치가 아닌 값을 찾아내는 기능을 가지고 있습니다.
그래서 bool로 출력이 되는데 결측치에는 False로 나오게 됩니다.
df_notna = pd.notna(df)
df_notna
df_notnull = pd.notnull(df)
df_notnull
notna, notnull의 기능이 똑같으니 아무거나 써도 상관은 없습니다.
isna와 정반대의 True,False가 나옵니다.
사실 결측치를 없애는 게 목적이라면 isna나 notna 보다는 dropna를 쓰면 되서 큰 의미는 없습니다.
대량의 데이터에서 어디에 결측치가 있는지 알아볼 때 쓰는 것이라서
자신의 기호에 맞게 isna나 notna를 쓰면 되지 않을까 싶습니다.
관련 포스팅
[Python/Pandas] - [Pandas] DataFrame 결측치(NaN) 처리
'Python > Pandas' 카테고리의 다른 글
[Pandas] 특정한 컬럼의 행 올리기,내리기(shift) (2) | 2021.12.17 |
---|---|
[Pandas] 중복데이터 병합하기(column이 모두 같은 경우) (3) | 2021.12.03 |
[Pandas]데이터프레임 로우와 컬럼 바꾸기(df.T) (0) | 2021.07.25 |
[Pandas] 문자열을 여러개의 컬럼으로 나누기 (0) | 2021.07.24 |
[Pandas] 데이터프레임 멀티인덱스 다루기(loc,xs) (0) | 2021.07.18 |