mysql 테이블 데이터프레임으로 불러오기sql 테이블을 데이터프레임으로 불러오는 방법입니다.큰 틀로 본다면 mysql에 연결한 후 해당 서버에서 테이블을 pd.read_sql()을 통해서 가져옵니다.pymysql을 이용한 방법pymysql 라이브러리를 이용해 테이블을 불러오겠습니다.pymysql로 mysql에 연결합니다.import pandas as pdimport pymysql# 데이터베이스 연결 설정con = pymysql.connect( host='localhost', user='root', password='비밀번호',port= port, database='your_database')# SQL 쿼리 실행 및 데이터프레임으로 변환 query = "SELECT * FROM your_..
try except 에러라인 출력하기파이썬에서는 try except로 예외 오류 처리를 함으로써 프로그램이 정지되지 않고 무사히 끝내는 장치가 마련되어 있습니다. 에러를 넘기고 무사히 프로그램을 끝낼 수 있어서 너무 좋은데 프로그램 고도화를 위해서는 에러를 일으키거나 어떤 에러가 주로 나오는지 알고 있어야 합니다.이번 포스팅에서는 try except를 이용해 에러를 일으키고 에러라인을 출력하는 방법에 대해 알아보도록 하겠습니다.에러 일으키기파이썬에서 try와 except 블록을 사용할 때, except 블록에서 에러를 다시 발생시키려면 raise 를 사용할 수 있습니다. 이렇게 하면 현재 예외를 다시 던져서 상위 호출 스택으로 전달할 수 있습니다. 나눗셈시 0으로 무언가를 나누면 에러가 발생합니다. 이런..
파이썬에서 Mysql 사용하는 간편한 방법(feat.pymysql)데이터베이스와의 연결은 애플리케이션 활용에 아주 중요한 역할을 합니다. 특히 Mysql은 오프소스 RDBMS로 전세계적으로 사용되고 있기 때문에 Mysql와의 연결은 아주 중요한데요. 파이썬에선 PyMySQL을 이용해 Mysql와의 연동이 가능합니다.PyMySQL이란?PyMySQL은 파이썬에서 MySQL 서버와 연결할 수 있도록 도와주는 라이브러리입니다. 기본적으로 MySQL 클라이언트와 통신하는 데 필요한 모든 기능을 제공합니다. PyMySQL은 순수 파이썬으로 작성되었기 때문에 MySQL C API의 래퍼(wrapper)로서 작동하는 다른 라이브러리들과 달리 외부 의존성이 없다는 장점이 있습니다.PyMySQL의 주요 기능MySQL 데이..
파이썬에서의 ~ 연산자 : 비트 반전과 논리 NOT 연산파이썬에서 ~ 연산자는 비트 반전 연산자(bitwise Not operator)로 사용됩니다. 아마 거의 본적이 없는 연산자인데 아무래도 비트반전을 시킬일이 거의 없기 때문에 관련 개발을 하지 않는 한 모르는 연산자가 아닐까 싶습니다. 비트반전 연산자의 역할은 간단합니다. 비트가 0이면 1로, 1이면 0으로 바꿔줍니다.비트 반전 연산자 예제비트 단위로 각 비트를 반전시키는 역할을 하는데 아래와 같이 반전됩니다.x = 5y = ~xprint(y) # 출력: -6정수 5(이진수 0000 0101)을 반전시켜 -6(이진수 1111 1010)이 됩니다.판다스에서의 사용~ 연산자는 판다스에서는 논리 NOT 연산자로도 쓰입니다. 특정 조건을 부정하는 필터를 ..
판다스 시트네임 확인하기빅데이터로 넘어가면 엑셀이나 csv 파일을 불러와서 뭔가 하기가 꺼려집니다. 너무 방대하거든요.특히, 일부 데이터만 필요한 경우, 다 불러올 필요가 없는 경우나 read_excel이나 read_csv를 사용하면 디폴트로 첫번째 시트만 불러와지기 때문에 다른 시트를 가져오려면 해당 시트 네임을 알아야 합니다.파이썬으로 시트 네임만 가져오는 방법을 알려드립니다.먼저, ExcelFile()을 이용해 엑셀 객체를 만들어줍니다.import pandas as pd # Excel 파일 경로 file_path = 'your_excel_file.xlsx' # Excel 파일 객체 생성 excel_file = pd.ExcelFile(file_path) sheet_names를 이용해 시트 확인을..
파이썬 리스트 같은 원소값 가져오기파이썬에서 두 개 이상의 리스트에서 공통된 원소값만 추출하는 방법입니다.별 게 아닌데 막상 하면 막막할만해서 정리겸 포스팅합니다.for문 이용가장 쉬운 방법은 for문을 이용하는 방법입니다. 직관적으로 코딩을 만들기 좋습니다.list1 = [1, 2, 3, 4, 5]list2 = [4, 5, 6, 7, 8]common_list = []#for문 이용for i in list1: for j in list2: if i == j: common_list.append(j)# in을 활용for i in list1: if i in list2: common_list.append(i)i를 고정하고 j와 맞춰보고 일치한다면 i를 com..
판다스 데이터프레임 문자열 조건 검색법 총정리데이터프레임 문자열 조건 검색 방법을 모아봤습니다.일반적인 방법== 조건을 이용하는 방법이 가장 일반적입니다.import pandas as pd# 예제 데이터프레임 생성data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [24, 27, 22, 32], 'City': ['New York', 'Los Angeles', 'Chicago', 'Miami']}df = pd.DataFrame(data)## Los Angeles 찾기result_and = df[df['City'] == 'Los Angeles']print(result_and)하지만, ==을 사용하면 정확히 일치한..
파이썬에서 수학함수 어떻게 쓰나? 코딩을 하다보면 수학함수가 의외로 많이 쓰입니다. 이번 포스팅은 자주 쓰는 수학함수를 math 모듈로 가져오는 방법에 대한 얘기입니다. math 모듈 math 모듈로 아주 간단하게 주요함수들을 불러올 수 있는데 누가 만들었는지 아주 기똥찹니다. 주로 자연상수 e나 삼각함수, 지수를 쓸때 유용합니다. 다른건 코드로 할 수 있기도 하지만 math모듈을 활용하면 코드량도 줄이고 간편하게 할 수 있는게 큰 장점입니다. 아나콘다나 미니콘다로 설치했다면 대부분 기본적으로 깔려 있습니다. 혹시 없다면 아래와 같이 math 모듈을 설치합니다. pip install math 주요한 수학 함수 수치계산이나 데이터 분석을 위해서는 모델링이 필수적인데 삼각함수나 지수로그함수가 적합한 모델일 ..
pyqt로 파일 불러오기 창이 나오게 하는 방법입니다. 개인적으로 프로그램 내에서 파일 불러오거나 폴더를 지정할 때 편해서 자주 쓰게 되는 기능입니다. 파일선택창 간단하게 pushbutton을 누르면 파일선택창이나 폴더선택창이 나오도록 하겠습니다. import sys from PyQt5.QtWidgets import * class MyWindow(QWidget): def __init__(self): super().__init__() self.setupUI() def setupUI(self): #레이아웃만들기 self.setGeometry(200,150,300,300) self.pushButton= QPushButton('Open file') self.pushButton.clicked.connect(sel..
파이썬의 os 모듈에 대해 정리합니다. 세세한것까지는 다 할 수 없고 쉽고 자주 쓰이는 것 위주로 정리합니다. 이 포스팅에 없다면 아래 파이썬 공식가이드에서 찾아보시기 바랍니다. 다 한글로 되어있어서 영어로 있었던 때보다는 훨씬 보기 편합니다. https://docs.python.org/ko/3/library/os.html os — Miscellaneous operating system interfaces Source code: Lib/os.py This module provides a portable way of using operating system dependent functionality. If you just want to read or write a file see open(), if you..
파이썬의 문자열을 html 파일로 저장하는 방법입니다. 사실 문자열에는 HTML 코드를 의미하고 저장하는 것입니다. 파이썬의 open(), write(), close()를 이용해서 html 파일을 작성할 수 있습니다. HTML 코드 준비하기 사실 막막할 수 있는데 html코드를 문자열화만 하면 됩니다. 글자 그대로 띄어쓰기 등 모든 것을 그대로 반영하려면 큰따옴표 3개를 앞에 써놓고 시작하면 됩니다. html_text = """ This is a Heading This is a paragraph. """ open(), write() 사용하기 저런 문자열은 open,write를 이용해서 파일로써 저장하면 됩니다. 이때 파일확장자로 html로 정의하면 html 파일이 만들어집니다. html_file = op..
요즘은 어떤지 모르겠지만 저는 개인적으로 자연어 맨처음 시작할 때 공부용으로 쓰던 NLTK입니다. 한글지원은 약하고 주로 영어를 사용합니다. 이미 생성AI가 나오는 판국에 이제와서 무슨 자연어 처리일까 싶겠지만 인공지능은 데이터기반으로 하기 때문에 내가 데이터만 잘 가져온다면 어디서든 새로운 걸 만들어낼 수 있습니다. 모두가 구글 될게 아니기 때문에 자신의 주변에서 필요한 부분이 분명 있을테니 영감을 얻는 도구로써 한번 체험해보시길 바랍니다. NLTK 소개 NLTK(Natural Language Toolkit)은 파이썬에서 자연어 처리를 수행하기 위한 라이브러리입니다. 텍스트 데이터 분석, 토큰화, 형태소 분석, 품사 태깅, 문장 구문 분석 등 다양한 자연어 처리 작업을 지원하며, 학술 연구부터 실제 응..
이번 블로그 글에서는 파이썬에서 RSS를 가져오는 방법을 다루려고 합니다. RSS란? RSS(Rich Site Summary 또는 Really Simple Syndication)는 웹 사이트에서 발행되는 최신 정보를 구독자에게 쉽게 제공하기 위한 XML 기반의 웹 피드입니다. RSS를 이용하면 웹 사이트의 새로운 글, 뉴스, 팟캐스트 등을 매우 쉽게 받아볼 수 있습니다. 파이썬에서 파싱하는 방법 파이썬에서 RSS를 가져오는 방법은 크게 두 가지로 나눌 수 있습니다. 첫 번째는 파이썬 라이브러리를 사용하는 방법이고, 두 번째는 HTTP 요청을 통해 직접 RSS 데이터를 가져오는 방법입니다. 파이썬 라이브러리 사용하기 파이썬에서는 feedparser 라이브러리를 사용하여 RSS를 파싱할 수 있습니다. 이 라..
matplotlib를 이용한 boxplot 그리는 방법입니다. boxplot에 나타내는 수치는 다섯가지로 다음 수치를 기반으로 그려집니다. 최소값 : 데이터의 0% 지점 제 1사분위 수(Q1) : 데이터의 25% 지점 제 2사분위 수 또는 중위수(Q2) : 데이터의 50% 지점 제 3사분위 수(Q3) : 데이터의 75% 지점 최대값 : 데이터의 100% 지점 이 값들로 그려진 boxplot에서 데이터를 크기순으로 나열했을 때의 분포지점과 이상치를 알 수 있습니다. 이상치는 Q3+1.5∗IQR 보다 크거나 Q1−1.5∗IQR 보다 작은 수로 나타냅니다. 여기서 IQR은 사분위수 범위로 Q3-Q1로 계산된 값입니다. 이상치로 판별된 데이터는 boxplot에서 점으로 나타나게 됩니다. matplo..
최근에 노트북을 새로 장만했습니다. 제 데스크탑에서 쓰던 개발환경 그대로 가져올 수 있는 방법이 있지 않을까 하는 마음에찾아보니 여러 방법이 있더군요. 그 중에서 conda를 이용한 방법을 정리합니다.설치방법은 간단합니다.conda로 기존의 개발환경 설치 패키지 목록을 .txt로 저장한 후새로 설치할 곳에 목록대로 설치해달라고 요청하면 됩니다. 패키지 설치 목록 가져오기내가 원하는 가상환경의 설치 목록을 가져오는 방법입니다. 설치 목록을 txt 파일로 저장하겠습니다.파워쉘이나 cmd에서 실행을 할건데 자신이 복사할 가상환경이 액티브되어 있는지반드시 확인하시고 실행하시기 바랍니다. 쥬피터에서도 물론 할 수 있습니다. 코드 앞에 !를 붙이고 실행하면 문제없이 돌아갑니다. 목록을 부르는 것이 conda lis..
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.