머신러닝은 지도학습, 비지도 학습, 강화학습 등 다양한 모델이 있습니다. 학습방법에 따라 성능에 대한 고찰도 약간씩 달라집니다. 이번 포스팅에서는 지도학습 모델에서 자주 쓰는 평가방식에 대해 정리하려 합니다.범주형 모델 평가범주형 모델은 분류를 목적으로 만든 모델입니다. 성능 또한 잘 분류했는지를 확인합니다. 평가를 위해서 혼동행렬(Confusion Matrix)를 이용하고 주로 F1_score나 ROC 곡선 점수로 평가를 합니다.혼동행렬, ROC 곡선에 대한 개념에 대한 자세한 내용은 아래 포스팅에서 확인하시기 바랍니다.[머신러닝] 혼동행렬(Confusion matrix) [머신러닝] 혼동행렬(Confusion matrix)이전 포스팅에서 MNIST에서 이진 분류기를 만들어 보았는데 글이 길어지다 보..
시리즈(Series)를 데이터프레임(DataFrame)으로 바꾸는 방법입니다. 시리즈의 차원은 1차원이고 데이터프레임은 2차원입니다. 서로 차원이 다르기 때문에 사용방법이 약간 다릅니다. 보통 데이터프레임에 익숙하기 때문에 때로는 시리즈를 데이터프레임으로 바꾸는 게 편할 때가 있습니다. 시리즈 데이터프레임으로 바꾸기 보통 groupby를 통해 톻계값을 출력하게 되면 시리즈로 바뀝니다. 값이 하나로 되면 시리즈로 바뀌게 됩니다. 이를 데이터프레임으로 바꿀 수 있습니다. 예를 보면 다음과 같습니다. import pandas as pd df = pd.DataFrame({'A':[1,30,70],'B':[2,30,80],'C':[3,40,90]}) df = df.T display(df) 통계값을 구하면 시리즈로..
데이터프레임 중복행 제거하는 방법입니다. 이전 포스팅에서 컬럼이 같은 경우에서 중복데이터 병합하기 포스팅을 작성했었는데요. 그 내용 중에서 중복행 제거하는 방법을 언급했었습니다. 그렇지만 데이터 병합에 초점으로 쓴 글이라서 생략된 것이 꽤 있었습니다. 이번 포스팅에서는 drop_duplicates 그 자체에 초점을 맞출까 합니다. 중복행 제거하기 중복행을 제거하려면 drop_duplicates() 밖에 쓸 게 없습니다. 파라미터는 다음과 같습니다. 함수 실행 후 Return은 중복행 제거 후 데이터프레임으로 나타납니다. DataFrame.drop_duplicates(subset=None, *, keep='first', inplace=False, ignore_index=False) subset : colu..
데이터프레임 내에서 순위 구하는 방법입니다. 순위도 어찌보면 데이터 정렬을 하는 것입니다. 다만, 데이터를 순위로 변환하고 동점처리를 어떻게 할것인가에 따라 정렬이 달라집니다. 파라미터는 다음과 같습니다. df.rank(axis=0,method='average',ascending=True,..) axis : 0(defualt)는 행, 1은 열을 기준으로 함 method : 동점처리 기준, 방법은 average(defualt), min, max, first, dense 으로 5가지가 있음. ascending : True(default) 오름차순을 반영해 순위(가장 작은 값이 1위), False 내림차순을 반영해 순위(가장 큰 값이 1위) 동점 처리 순위를 하다보면 동점이 나오는 경우 어떻게 할지 정해야 합..
오라클을 쓸 경우 디비버(DBeaver)라는 SQL 편집기를 보통 씁니다. 근데 설치를 막 했거나 업데이트를 하면 비밀번호 만기가 있다고 비밀번호를 바꾸라고 합니다. 내가 언제 비밀번호를 했었나? 라는 생각이 문득 들었는데 뭔지도 모르니 일단 지켜보았는데 ... 2일 남았다고 하니 당황스럽더군요. 보안 때문에 비밀번호를 계속 바꾸라는 것은 이해하겠으나 저는 개인용으로 쓰는 거라 비밀번호를 굳이 바꿔가며 살 필요는 없습니다. 매번 비밀번호를 바꿔야하는 생각이 들어서 만기를 없앨 수 있는지 알아보았더니 역시나 있었습니다. 패스워드 기간 변경 디비버를 켠후 SQL 구문을 치면 테이블이 하나뜹니다. select resource_name,resource_type,limit from dba_profiles; 여기서..
파이썬 문자열 공백 없애는 방법입니다. 공백 없애는 방법에는 3가지가 있습니다. 파이썬 replace 함수 이용해서 공백 제거 파이썬 strip함수 이용 해서 공백 제거 (rstrip, lstrip) 정규표현식의 sub함수 이용해 공백 제거(re.sub) 1. replace 함수 이용해서 공백 제거 replace 함수는 문자를 바꿔주는 함수인데 파이썬에서는 공백도 문자로 취급하기 때문에 replace함수를 적용할 수 있습니다. 쓰는 방식은 문자열.replace(없앨 문자,바꿀 문자) 입니다. 공백은 " "으로 되어 있습니다. 이를 ""으로 바꾸면 됩니다. replace는 기존 데이터에 반영이 안되므로 새로 정의를 해주어야 합니다. str = ' A B C D ' new_str = str.replace("..
Visual Studio Code의 자동완성 기능 해제 방법입니다. 자격증 시험을 보면 오픈북 시험을 제외하면 코딩을 외워서 써야 합니다. 그래서 시험과 유사한 환경을 만들려면 자동완성 기능부터 해제해야 하는데요. vscode 자동완성 기능을 해제해 시험과 유사한 환경을 만드는 것을 추천합니다. 자동완성 기능 해제 해제방법은 아주 간단합니다. vscode의 설정(Ctrl + , 또는 Command + ,)으로 들어가서 검색항목에 intelliSense를 검색하면 여러 체크박스 리스트를 볼 수 있습니다. 체크되어 있는 모든 걸(Show Classes~Show Words) 체크해제하면 자동완성 기능을 해제할 수 있습니다. 세련된 방법 옵션을 일일히 체크해제하기에 너무 많다 생각하면 설정 JSON을 이용합니다..
칫솔은 치아에 낀 이물질과 음식 찌꺼기를 제거하기 때문에 세균번식에 아주 좋은 환경이 조성됩니다. 그래서 칫솔이 깨끗하지 않은 상태에서 이빨닦기를 하면 이빨을 더 더럽히는 셈이 됩니다. 물론 치약의 성분이 치아에 낀 음식을 제거하고 치태를 없애주기 때문에 어느정도는 칫솔에 살균효과가 나타나기 때문에 칫솔세균 때문에 병에 걸려 죽을정도는 아닙니다. 그런데 이왕이면 칫솔이 깨끗한 상태에서 이빨을 닦는게 더 좋지 않을까요? 시중에 나와 있는 휴대용 칫솔살균기를 사용하면 칫솔 살균이 되어 있어서 병에 걸릴 불안감(?) 없이 기분좋게 칫솔질을 할 수 있습니다. 리빙유 UVC 에어 바람건조 휴대용 칫솔살균기 COUPANG www.coupang.com 칫솔살균기는 건전지식이나 충전식으로 되어있고 편리한 거 아무거나 ..
사분위수란 데이터를 가장 작은 값부터 큰 값으로 나열하고 4등분을 했을 때의 각 등분에 해당하는 값을 말합니다. 그래서 4등분했을 때의 값들을 등위라고 하는데 제p사분위수 라고 합니다. 제1사분위수(Q1) : 전체 데이터를 사등분했을 시 1번째에 해당하는 값, 데이터를 작은수부터 나열했을때 25% 지점에 해당하는 수. 제2사분위수(Q2) : 전체 데이터를 사등분했을 때 2번째에 해당하는 수, 50% 지점에 해당하는 수로 중간값(median)과 동일 제3사분위수(Q3) : 전체 데이터를 사등분했을 때 3번째에 해당하는 수, 75% 지점에 해당하는 수 사분위수 범위(Interquartile range,IQR) : Q3-Q1으로 자료 집합의 50%를 가지는 값의 범위. 실생활에서 많이 쓰는 등분은 100,10..
모델링 모델링은 현실세계에서 있는 것들을 컴퓨터 앞에 가지고 와서 한눈에 보고 일처리할 필요성으로 만들어진 기법입니다. 현실세계의 복잡한 데이터를 일정한 표기법으로 규칙을 가지고 컴퓨터에 표기하는 작업이라 할 수 있습니다. 그렇기 때문에 체계적이고 명확해야 합니다. (명확화) 복잡한 세계에 있는 걸 가져와 다룰려면 단순해져야 합니다.(단순화) 그렇다고 현실세계의 특징을 아예 배제해서는 안되고 특징을 담되 컴퓨터에서 하나의 객체로 표현하는 작업이 되어야 합니다.(추상화) 모델링 특징 3가지 앞에서 언급한대로 모델링의 특징으로 3가지로 정리할 수 있습니다. 추상화 (모형화, 가설적) : 현실세계를 일정한 형식에 맞추어 표현 (일정한 양식 표기법) 단순화 : 복잡한 현실세계 약속된 규약에 의해 제한된 표기법/..
마크다운(.md)를 pdf로 변환하는 방법입니다. 웹사이트에서 할 수 있긴 하지만 인코딩이 안 맞으면 한글은 깨져서 나옵니다. 그건 vscode에서도 마찬가지인데 통제하고 컨트롤하기 쉬운 쪽이 vscode입니다. 웹사이트 컨버터보다 빠르고 vscode 안에서 pdf 확인이 바로 되서 신속하게 파일변환하고 확인할 수 있습니다. Markdown pdf vscode의 확장에서 Markdown PDF을 받아줍니다. 인코딩이 UTF-8인지 확인합니다. 안되었다면 UTF-8부분을 클릭해 맞는 것을 선택합니다. 변환할 문서를 열고 도움말 - 모든 명령표시 또는 [Ctrl+Shift+P]를 눌러줍니다. Markdown PDF html, png, jpeg도 변환가능합니다. 그렇지만 pdf를 원하니깐 Markdown PD..
구글 설문지 응답 결과 확인 방법과 엑셀로 저장하는 방법입니다. 구글 설문지의 사용방법을 모르시다면 아래 포스팅을 참고하시기 바랍니다. 구글 설문지(폼) 만들기 구글설문지(폼) 설정 방법 총정리 구글 docs 바로가기 : https://www.google.com/intl/ko_kr/forms/about/ Google Docs Google Docs. 좋아하는 사람 55,544명 · 이야기하고 있는 사람들 419명. News and updates about Google Docs, Sheets, Slides, Sites, Forms, and more! www.facebook.com 구글 설문지 응답 결과 보기 설문지를 완성한 후 링크나 이메일로 응답자에게 보낸 후 응답 확인을 실시간으로 확인할 수 있습니다. ..
구글폼 설정 설명입니다. 설문 형식이 아닌 퀴즈 형식으로 바꿀 수 있고 응답에 대한 설정, 진행률 표시바를 넣는 등을 할 수 있습니다. 구글폼을 만들고 보내는 작업에 대한 내용은 아래 포스팅에서 확인하시기 바랍니다. 구글 설문지(폼) 만들기 구글 설문지(폼) 만들기 구글 설문지 사용방법입니다. 구글 설문지는 설문조사나 행사 참여같은 많은 사람에게 응답을 받기 위해 사용되는데요. 사용방법도 간단합니다. 구글 설문지(폼) 만들기 크롬 첫화면에서 계정 seong6496.tistory.com 설정하기 구글 설문지 상위에 설정창이 있습니다. 퀴즈만들기 온라인 퀴즈를 만들 수 있습니다. 선생님이 학생에게 문제를 내주고 점수할당도 가능합니다. 더하여, 자동 채점도 해줍니다. 성적공개 여부와 응답자가 틀린문제,정답,점..
구글 설문지 사용방법입니다. 구글 설문지는 설문조사나 행사 참여같은 많은 사람에게 응답을 받기 위해 사용되는데요. 사용방법도 간단합니다. 구글 설문지(폼) 만들기 크롬 첫화면에서 계정 로그인이 되어있다면 아래 그림과 같이 구글 제품을 볼 수 있는데 그 중 설문지를 클릭해 들어갑니다. 구글 설문지 바로가기 :https://www.google.com/intl/ko_kr/forms/about/ Google Docs Google Docs. 좋아하는 사람 55,456명 · 이야기하고 있는 사람들 313명. News and updates about Google Docs, Sheets, Slides, Sites, Forms, and more! www.facebook.com 설문지에 들어가면 여러가지 테마를 볼 수 있..
원룸에 살면 정수기 놓는게 여간 부담스러운게 아닙니다. 혼자 사는데 얼마나 물을 먹겠다고 24시간 전기를 틀고 있는것도 그렇고 주방 공간도 작은데 정수기를 놓기가 애매합니다. 대안으로 생수를 사는데 인터넷으로는 한번에 많이 사야하고 매장에서 사야 적게 사기 때문에 공간차지를 안합니다. 하지만.. 배달을 매번할수도 없고 결국은 집까지 직접 가져와야 합니다. 패트병 공간 차지와 분리수거를 계속 신경써야 해서 여러모로 불편함이 많습니다. 이번에 소개하는 브리타는 물통 안에 필터를 두어서 자체 정수가 가능한 제품으로 정수기를 따로 둘 필요가 없고 패트병도 무지막지하게 살 필요가 없습니다. 브리타 물통 하나면 해결됩니다. 자세한 내용은 아래에서 확인하시기 바랍니다. https://link.coupang.com/a..