데이터프레임에서 특정조건의 데이터를 필터링하는 2가지 방법을 소개하겠습니다. isin()을 이용하는 방법 비교 조건문을 이용하는 방법 다음과 같이 소문자, 대문자로 이루어진 데이터프레임을 만들었습니다. df = pd.DataFrame({'alpha' : ['a','b','c','d','e'],'beta':['A','B','C','D','E']}) df isin()을 이용하는 방법 isin()을 하면 해당 원소가 있는지를 판단해줍니다. 즉, 해당 값이 있으면 True, 없으면 False를 반환합니다. df['alpha'].isin(['a','b']) 이것을 이용하면 필터링이 가능합니다. df[df['alpha'].isin(['a','b'])] and(&),or(|) 도 가능합니다. df[df['alpha'..
데이터를 수집하면 전산오류나 사람의 실수로 결측치가 발생하게 됩니다. 특히 외부에서 데이터를 가져오면 더욱 그럴 수 밖에 없는데 결측치를 방치하고 알고리즘에 데이터셋을 넣게 되면 아무리 좋은 알고리즘이라도 성능이 떨어지고 엉뚱한 결론에 도달할 수도 있습니다. 돈과 관련된 것이라면 아주 치명적인 결과를 만들수도 있습니다. 따라서 본격적인 분석을 하기 전에 결측치를 먼저 처리하는 과정이 필요합니다. 결측치를 처리하는 방법을 몇 가지 소개하겠습니다. 먼저 간단한 DataFrame을 만들겠습니다. import numpy as np import pandas as pd r1 = [1,np.nan,2,3] r2 = [4,5,np.nan,6] r3 = [7,8,9,np.inf] df = pd.DataFrame({'r1..