판다스(Pandas)에서 조건에 맞는 행 제외하는 방법판다스를 활용하다 보면 특정 조건에 맞는 행만 선택하거나 제외해야 하는 상황이 자주 발생합니다. 이 글에서는 판다스에서 특정 조건에 맞는 행을 제외하는 방법을 여러 가지 예제를 통해 살펴보겠습니다. 데이터 분석과 전처리 과정에서 매우 유용한 테크닉이니 꼭 알아두세요!조건에 맞는 행 제외하기: 기본 원리판다스에서 조건에 맞는 행을 제외하려면 부울 인덱싱(Boolean Indexing)과 ~ 연산자를 사용합니다. ~는 조건을 반전(negate)시켜 해당 조건에 맞는 행을 제외하도록 도와줍니다. import pandas as pd데이터프레임 생성data = {'이름': ['Alice', 'Bob', 'Charlie', 'David'],'나이': [25, ..
딕셔너리 컨프리핸션파이썬은 코드의 간결함이 가장 큰 장점이요. 이전 포스팅에서 컴프리핸션(list comprehension) 작성요령만 써놨는데 이번 포스팅에서는 딕셔너리 컴프리핸션에 대해 더 써볼까 합니다.기본 문법딕셔너리 컴프리핸션은 한 줄의 코드로 for문이 딕셔너리 안에서 작동할 수 있게 해주는 문법입니다. 기본적인 문법은 다음과 같습니다.{키_표현식: 값_표현식 for 요소 in 반복 가능 객체 if 조건식}키_표현식 : 딕셔너리의 키로 사용할 값.값 표현식 : 딕셔너리의 값으로 사용할 값.반복 가능 객체 : 리스트, 튜플, 문자열, 또는 range와 같은 반복 가능한 객체조건식(선택) : 특정 조건을 만족하는 경우에만 요소 포함.딕셔너리 컴프리핸션의 장점가독성 향상 : 코드가 간결해져 읽기 쉬..
파이썬에서 Mysql 사용하는 간편한 방법(feat.pymysql)데이터베이스와의 연결은 애플리케이션 활용에 아주 중요한 역할을 합니다. 특히 Mysql은 오프소스 RDBMS로 전세계적으로 사용되고 있기 때문에 Mysql와의 연결은 아주 중요한데요. 파이썬에선 PyMySQL을 이용해 Mysql와의 연동이 가능합니다.PyMySQL이란?PyMySQL은 파이썬에서 MySQL 서버와 연결할 수 있도록 도와주는 라이브러리입니다. 기본적으로 MySQL 클라이언트와 통신하는 데 필요한 모든 기능을 제공합니다. PyMySQL은 순수 파이썬으로 작성되었기 때문에 MySQL C API의 래퍼(wrapper)로서 작동하는 다른 라이브러리들과 달리 외부 의존성이 없다는 장점이 있습니다.PyMySQL의 주요 기능MySQL 데이..
데이터프레임 컬럼값 타입 확인하고 바꾸기데이터를 외부에서 받아오면 불가피하게 타입이 고르지 못하고 중구난방으로 다운로드됩니다. 이 상태로 데이터프레임으로 전체 행, 열 계산을 하려고 할 때 애를 먹을 수 있습니다. 이번 포스팅은 컬럼값 타입을 확인하고 혹시 다른 타입이 있다면 어떻게 바꿔야 하는지에 대해 소개합니다.컬럼값 타입을 확인하려면 isintance 함수를 알아야 합니다.파이썬 타입 확인 함수 isintance 파이썬에서 데이터타입을 boolean으로 판단하려면 isinstance()함수 사용합니다. isintance는 파이썬의 내장함수라서 따로 설치할 라이브러리가 없습니다. 파이썬이 설치되어 있다면 바로 쓸 수 있습니다. isinstance()는 object(변수나 객체), classinfo(타..
시트만 다른데 매번 다시 불러야하나? 판다스에서 엑셀시트를 불러오는 방법으로 보통 read_excel(sheet_name = '시트이름')을 쓰게 되는데 이러면 시트를 부를 때마다 excel을 부르고서 sheet_name을 다르게 해서 엑셀파일 자체를 다시 읽게 됩니다. 즉, 시간소비가 많다는 것이죠. (이런 시간낭비...) 그래서 엑셀 파일을 객체로 만드는 방법을 알아냈습니다. 판다스 내에 엑셀 파일을 객체로 불러와서 시트만 불러내는 방식을 사용할 수 있더라고요. 이 방식을 사용하면 엑셀파일은 불러와있는 상태에서 시트만 선택적으로 꺼내쓰는 방식으로 바뀝니다. 시간도 절약하고 시트관리가 좀 더 용이해집니다. 엑셀 파일 객체로 불러오기(ExcelFile) 판다스에 ExcelFile이라는 메쏘드가 있습니다...