Json 파일 만들기 Json은 자바스크립트의 객체 표기법으로부터 파생된 부분 집합으로 몇 가지 표기법에 의해 구조가 구성됩니다. Json 데이터는 '키 : 값' 의 딕셔너리 형태로 이루어집니다. 콜론으로 구분됩니다. 여러 '키:값'은 쉼표(,)로 데이터를 구분합니다. 객체(object)는 중괄호({})로 표현합니다. 배열(array)은 대괄호([])로 표현합니다. 예를 들어, 어떤 사람의 정보를 객체로 json으로 표현하다고 하면 다음과 같이 할 수 있습니다. { "name": "John", "age": 30, "city": "New York" } 대괄호로 둘러쌓인 값들은 주로 리스트로 표현되는데 이 배열을 쉼표로 구분해서 표현합니다. { "name": "John", "age": 30, "city": ..
EPUB 뷰어 PC에서 전자책을 읽어 볼 수 있는 EPUB 뷰어 5가지 종류에 대해서 알아보겠습니다. 교보문고나 알라딘에서 제공하는 뷰어들이 있는데 본인이 EPUB을 갖고 있는 경우 접근하는게 오히려 어렵습니다. 대형서점에서 제공하는 뷰어는 책구매에서 뷰어까지 이어지는 프로세스에 초점을 맞춰져 있어서 그외의 상황에는 접근성이 떨어지는 건 사실입니다. Adobe Digital Editions, EPUB 뷰어 어도비 디지털 에디션 입니다. 어도비 사에서 제작된 전자책 뷰어로 기본적인 기능이 있는 뷰어입니다. Adobe Digital Editions 다운로드 사용법이 있긴 하지만 바로 쓸 수 있을 정도로 간편합니다. 다만 조금 무겁습니다. freda epub ebook reader 고급 기능이 다양하게 있는 ..
파이썬으로 전자책 추출이 된다고? 파이썬으로 전자책을 읽고 쓰는 라이브러리를 소개할까 합니다. 전자책은 뷰어로 보면 되는데 굳이? 라는 생각이 들 수 있으나 이것도 데이터로 생각하면 전자책도 좋은 자원이라서 자연어 처리를 하는 용도로써 사용해보는 것도 좋을 것 같습니다. 이건 연습용입니다. 남의 저작권을 가져다가 상업용으로 쓰려면 그에 대한 저작권 협의가 있어야 함을 꼭 명심하셨으면 좋겠습니다. ebooklib epub는 일반적으로 xml이 압축된 형태로 파일의 형태를 잘 이해하고 있다면 zip을 이용해 압축해제를 해서 어찌어찌 할 수 있는데 약간 복잡합니다. 이런 걸 이미 ebooklib라는 라이브러리를 통해 할 수 있게 되었습니다. 몇 줄의 코드로 epub파일을 불러올 수 있습니다. 설치는 간단합니다..
곡선의 넓이 구하기 곡선의 넓이를 구하는 방법은 고대부터 이어오는 연구였는데 적분이라는 개념으로 통합되면서 현재 우리가 적분으로 곡선의 넓이를 구하게 되었습니다. 결론만 요약해서 얘기하면 극한의 개념이 있기 전까지는 적분이라는 것을 쓸 수 없었는데 극한의 개념이 전파되면서 적분을 쓸 수 있게 되었습니다. 이번 포스팅은 적분의 전형태인 구분구적법에 대한 얘기를 쓸까 합니다. 구분구적이라는 말은 한자어로 measuration by parts를 한자로 번역한 것입니다. 여기서 구분은 말그대로 '구분'한다는 것인데 수학적 관점으로 보면 쪼갠다는 의미로 받아들일 수 있습니다. 작은 도형으로 만드는 것이지요. 구적법은 meansuration 으로 면적을 구하는 방법이라 합니다. 즉, 구분구적법은 어떤 도형의 넓이 ..
알리 익스프레스 원화 결제 차단하고 달러로 결제하는 방법 알리 익스프레스도 해외 사이트다 보니 원화로 결제하면 수수료가 지불됩니다. 그래서 달러로 결제해주어야 수수료를 아낄 수 있습니다. 이게 할 줄 알면 쉬운데 처음 하면 어려워서 저처럼 헤매시는 분들을 위해 공유합니다. 진짜 엄청 쉽습니다. PC 버전 PC에서 알리에 들어가면 오른쪽에 아래 그림과 같이 KRW 위치가 보이는데 여길 클릭한 후 통화에서 USD를 검색합니다. 그 후 저장합니다. 모바일 버전 알리 익스프레스가 모바일로도 있는데 여기는 계정 - 설정으로 들어갑니다. 통화를 클릭합니다. USD를 검색한 후 선택합니다. 끝입니다. 너무 간단합니다. USD로 설정해놓은 탓에 달러 가격으로 물건가격을 봐야하는 단점이 있긴 합니다만 이런 조치만 해도 ..
엑셀 파일 빠르게 읽어보자 빅데이터를 다루다보면 엑셀 파일 불러올 수 밖에 없는데 데이터 자체가 크다보니 불러오는 시간이 많이 소요됩니다. 이걸 여러번 불러온다면 곤욕이 따로 없겠죠? 이전 포스팅에서 xlsx에서 csv로 변환하는 방법을 다뤘었는데 csv로 변환하고 읽는 속도가 약 70배 빨라지는 것을 알 수 있었습니다. 이번 포스팅에서는 본격적으로 불러오는 속도를 극대화하는 방법에 대해 소개할까 합니다. DASK 모듈 이용하기 방법은 생각보다 간단합니다. 데이터를 불러올 때 병렬처리를 한다면 보다 빠르게 불러올 수 있게 됩니다. 그런데 이걸 코드로 만들어내면 귀찮아지니 다 만들어진 모듈을 사용해서 간편하게 불러올 수 있을 거라 생각합니다. DASK라는 모듈을 쓸 건데요. 이 모듈은 파이썬에서 분산 병렬..
윈도우에서 클립보드 관리 윈도우에서는 기본적으로 탑재되어 있는 기능입니다. Win+v를 누르면 기존에 복사했던 내용들이 임시로 저장하는 공간이 나오는데 이를 클립보드라고 합니다. 텍스트는 당연히 가능하고 그림도 가능합니다. 그런데 Ditto라는 프로그램을 통해 더 업그레이드 할 수 있는데 윈도우는 종료시 클립보드의 내용이 삭제되지만 Ditto는 보관됩니다. 그래서 컴퓨터를 껐다켜도 클립보드에 저장된 내용을 사용할 수 있습니다. 설치 방법 두가지 방법으로 설치할 수 있습니다. 편한 방법으로 설치하시면 됩니다. Microsoft stroe 에서 설치 Microsoft store 에서 ditto 검색 후 설치를 합니다. 사이트에서 직접 다운로드 다운로드 경로 : https://ditto-cp.sourcefor..
요즘 검색엔진도 사용하지만 키워드를 모르면 ChapGpt에 먼저 손을 대는 것 같습니다. 그런데 다른 나라 언어로 나오는 걸 한글로 바꿀려면 '한국말로 해줘'를 써줘야 하는 귀찮음이 있네요. 그러면 다 바꿔주기는 합니다. 웃긴건 뭔가 바뀐다는 거에요. 똑같은 내용은 나오는데 말이 바뀌는 느낌입니다. 영어로 쓴걸 한글말로 해달라고 했는데 저렇게 긴게 '두 주간의 유렵여행 일정을 계획해 드리겠습니다' 로 간단히 바껴버립니다.(영어못한다고 무시하냐...) 그래서 번역만 해주는 기능으로 해줄까 해서 확장 프로그램을 설치해서 사용해봤습니다. 프롬프트 지니 설치 프롬프트 지니는 ChatGPT를 자동으로 번역되거나 직접 버튼을 눌러서 번역해서 질문을 바꿔줄 수 있습니다. 설치하는 방법은 크롬 웹스토어에 가서 프롬프트..
xlsx -> csv의 필요성 파이썬에서 xlsx로 작업을 하면 제약사항이 많아집니다. 가장 큰 제약은 느린 불러오기입니다. xlsx를 불러오는 것부터가 곤욕입니다. 그 이후에 판다스에서의 작업은 사실 xlsx 파일과는 무관하기 때문에 상관은 없습니다. 하지만, 계속해서 xlsx를 불러와야 하는 상황이라면 얘기가 달라집니다. 훨씬 빠른 불러오기가 가능한 csv로 변환합니다. 변환을 office를 이용하면 손쉬운데 실제로 해보면 오류도 많고 드럽게 안됩니다. 또한 office는 csv를 했다해도 office에서 원하는 방향으로 만들어지기 때문에 제약이 들어갑니다. 그래서 파이썬 내에서 xlsx를 가져와 csv로 바꿔보겠습니다. xlsx 파일 csv로 변환하기 프로세스는 간단합니다. 판다스로 xlsx 불러오..
시트만 다른데 매번 다시 불러야하나? 판다스에서 엑셀시트를 불러오는 방법으로 보통 read_excel(sheet_name = '시트이름')을 쓰게 되는데 이러면 시트를 부를 때마다 excel을 부르고서 sheet_name을 다르게 해서 엑셀파일 자체를 다시 읽게 됩니다. 즉, 시간소비가 많다는 것이죠. (이런 시간낭비...) 그래서 엑셀 파일을 객체로 만드는 방법을 알아냈습니다. 판다스 내에 엑셀 파일을 객체로 불러와서 시트만 불러내는 방식을 사용할 수 있더라고요. 이 방식을 사용하면 엑셀파일은 불러와있는 상태에서 시트만 선택적으로 꺼내쓰는 방식으로 바뀝니다. 시간도 절약하고 시트관리가 좀 더 용이해집니다. 엑셀 파일 객체로 불러오기(ExcelFile) 판다스에 ExcelFile이라는 메쏘드가 있습니다...
윈도우11 시간 동기화 오류 윈도우 11시간 동기화 오류 났을 때 방법입니다. 윈도우가 자잘한 오류가 많은데 시간이 안 맞을 때가 있더라고요. 이건 여태 윈도우를 사용하면서 처음봤습니다. 어쨋든 며칠동안 2분씩 느려져서 좀 불편했는데 몇번 클릭으로 간단하게 해결됩니다. 해결방법 윈도우 검색에서 시스템 - 시간 및 언어- 날짜 및 시간을 들어갑니다, 날짜 및 시간을 들어가면 자동으로 시간설정과 표준시간대가 보입니다. 한국에서 살고 있다면 (UTC+09:00)서울로 되어있을겁니다. 여기서 자동으로 시간설정 켬/끔을 반복합니다. 저는 한번에 시간 동기화가 됐는데 여기저기 찾아보니깐 2~3번은 해야하는 것 같습니다. 켬/끔을 반복후 시간이 제대로 돌아가게 됩니다.
파이썬에서 수학함수 어떻게 쓰나? 코딩을 하다보면 수학함수가 의외로 많이 쓰입니다. 이번 포스팅은 자주 쓰는 수학함수를 math 모듈로 가져오는 방법에 대한 얘기입니다. math 모듈 math 모듈로 아주 간단하게 주요함수들을 불러올 수 있는데 누가 만들었는지 아주 기똥찹니다. 주로 자연상수 e나 삼각함수, 지수를 쓸때 유용합니다. 다른건 코드로 할 수 있기도 하지만 math모듈을 활용하면 코드량도 줄이고 간편하게 할 수 있는게 큰 장점입니다. 아나콘다나 미니콘다로 설치했다면 대부분 기본적으로 깔려 있습니다. 혹시 없다면 아래와 같이 math 모듈을 설치합니다. pip install math 주요한 수학 함수 수치계산이나 데이터 분석을 위해서는 모델링이 필수적인데 삼각함수나 지수로그함수가 적합한 모델일 ..
타블릿 무선연결하기 저희집은 컴퓨터 모니터와 키보드 사이가 멉니다. 그래서 키보드,마우스를 모두 무선으로 쓰고 있습니다. 가끔 줌 강의를 하는데 아이패드로 사실 미러링을 하면 너무나도 편하게 할 수 있지만 빠데리가 훅훅 달기도 하고 pc에서 바로 파일에 쓰면 아이패드로 파일옮길 필요도 없어서 너무 편할 것 같더라고요. 결국 찾아낸 것이 타블릿! 그리고 무선! 이었습니다. 동생과 얘기한게 있어 바로 동생에게 사달라고 졸랐습니다. 타블릿을 사용하면 컴퓨터에 바로 펜으로 쓸 수 있어서 확실히 편합니다. 줌에서는 화이트보드 기능이 있어서 말로 설명이 안 될때 바로 쓰면 끝납니다. 타 기종은 블루투스 기능이 없어서 찾아헤매느라 힘들었네요 ㅜ ugee s640w를 쓰면 배터리가 많이 안 들고 블루투스 연결로 멀리서..
자연대수 e를 이용한 복리법 복리법은 복리법인데 난데없이 자연대수 e을 가져다쓰는 어그로에 적잖이 의문을 가질 것 같습니다. 하지만 잘 따져보면 e가 복리 성질이 있는 것의 모델링을 할 때 굉장히 중요하다는 것을 느낄 수 있습니다. 일반적인 복리계산법 일반적으로 알려진 복리계산법은 다음과 같습니다. 원금 A, 이자 r, 주기 n, 기간 t일 때, 원금에 대한 복리는 $$ A(1+r/n)^nt $$ 입니다. 예를 들어, 1000달러에 연이자 6% 이자갱신 주기가 하루인 복리상품을 3년동안 저축한다고 하면 3년 후에는 다음을 받게 됩니다. $$ 1000(1+0.06/365)^{365*3} = 1197.19 $$ 으로 약 1197.2 가 됩니다. 여기서 알 수 있는건 n이 증가할 때마다 지급되는 이자 또한 증..
자연로그의 밑 e 자연상수 e 또는 자연로그의 밑 e라고 불리는 수로 수학에서 $\pi$ 와 함께 가장 자주 쓰는 상수라고 할 수 있습니다. 자연상수 e는 전혀 자연스럽게 생긴 수가 아닙니다. 어떤 필요에 의해 만들어진 수입니다. e가 있음으로 많은 것들을 이어나갈 수 있고 편리해졌습니다. 이번 포스팅은 자연대수 e에 대한 정의파트를 다루려고 합니다. e의 정의 e는 사실 정의하기 나름인데 개인적으로 모델링을 할 때 도움이 많이 되는 미적분에서 전개하는 방식으로 하려고 합니다. 간단한 지수함수에 대한 미분을 구해보겠습니다. 만약 $f(x)=b^x$라 할 때, 미분을 구하면 $$ f'(x) = lim_{h->0}\frac{f(x+h)-f(x)}{h} $$ $$ = lim_{h->0}\frac{b^{x+h}..