파이썬에서 공공데이터나 외부에서 크롤링을 json 형태로 가져오게 되면 dict형식인데 string으로 가져올 때가 있습니다. string 자체로는 데이터 처리를 하기가 굉장히 난감합니다. 더군다나 dict형식으로 되어있어서 더더욱 어렵습니다. string을 완벽한 dict형식으로 바꾸어야 판다스에서 데이터 전처리를 할 수 있게 됩니다. 사실 json으로 바꾸는 거긴 합니다 json이라 하면 잘 모를수도 있으니깐 일단 dict형식이라고 하겠습니다 json 모듈을 이용해 dict으로 변환합니다. json 활용 dict_string = '{"a":"b","a2":"c"}' type(dict_string) to_json = json.loads(dict_string) type(to_json) 이런식으로 바꾸고 ..
깃 블로그 만들기 두번째 포스팅입니다. 첫번째 포스팅에서는 일단 블로그를 오픈하는 과정을 넣었었고요. 두번째 포스팅에서는 블로그에 테마를 적용하는 방법에 대해 알아볼까 합니다. 아직 Github 블로그를 오픈하지 못했다면 다음포스팅에서 확인하시기 바랍니다. Github 블로그 만들기(window) Github 블로그 만들기(windows) 요즘 개발자들이 많이 사용하고 있는 Github 블로그 만드는 방법입니다. 장단점이 확연한데 본인의 성향에 맞게 사용할지를 결정하면 될 것 같습니다. 뭐든 그렇지만 필요하면 만들어 쓰면 그만 seong6496.tistory.com 테마 적용하기 테마 고르기 다음 사이트에서 테마를 고르면 됩니다. http://jekyllthemes.org/ 사이트가 여러개 있긴 하지만 ..
R에서의 벡터에 대한 내용입니다. 벡터 벡터는 R의 기본 데이터 단위입니다. 원소(스칼라)가 하나이면 원자 벡터라고 합니다. 하나의 데이터 타입만이 가능하기 때문에 숫자형, 논리형, 글자형 중 하나로만 입력이 가능합니다. c(...)으로 입력하면 벡터가 만들어집니다. > c(1,2,3,4) [1] 1 2 3 4 R에서의 모든 데이터는 key-value 방식이 가능해서 이름을 지정할 수 있다. > c(a=1,b=2,c=3,d=4) a b c d 1 2 3 4 강제형변환 벡터는 기본적으로 같은 데이터 타입만을 가질 수 있습니다. 그럼에도 다른 데이터 타입을 넣으면 오류가 뜨진 않고 강제로 데이터 타입을 고정시켜버립니다. 이것을 강제형변환이라고 합니다. 강제형변환이 되는 우선순위는 문자형 숫자형 논리형 으로 ..
R 데이터 타입 R의 데이터 타입 내용입니다. R의 데이터 타입 종류와 확인방법에 대해 포스팅하려고 합니다. 각각을 모두 다 설명할 수는 없고 어떤 게 있는지에 초점을 맞췄습니다. R은 1,2,n차원 자료로 이루어져 있습니다. 차원마다 특징이 있고 그 특징을 잘 아는 것이 중요합니다. 어떤 데이터 타입인지 명확해야만 고급기법을 사용할 때 유용하기 때문이죠. R의 데이터 기본 타입은 숫자형(numeric), 문자형(chararcter), 논리형(logical) 으로 구분됩니다. 데이터 타입 유형을 표로 정리하면 다음과 같습니다. 유형 설명 숫자형(numeric) 정수(integer),실수(double)를 저장하는 객체 형식 문자형(character) 문자나 문자열을 저장하는 객체 형식 논리형(logical..
프로그래밍은 변수 선언이 필수인데요. R에서도 변수 선언을 합니다. 그리고 R만의 변수 생성 규칙이 있습니다. 물론 프로그래밍 언어에 익숙하다면 당연한 얘기이긴 합니다. 변수 생성 규칙을 살펴보기 전에 먼저 변수를 정의하고 시작하겠습니다. 변수 정의 다양한 값을 지니고 있는 하나의 속성으로 여러 변수가 모여서 데이터가 됩니다. 변수 선언 변수를 선언하려면 대입 연산자를 써야 합니다. 대입연산자는 다음과 같습니다. 연산자 의미 = 왼쪽 변수에 오른쪽 값 대입 오른쪽 변수에 왼쪽 값 대입 R에서는 보통 을 쓴다면 반대로 되겠죠? a = 'pie' b
많은 분들에게 책을 어디서 구하는지 문의가 있어서 답변을 일일히 하기도 어렵고 해서 간간히 책리뷰를 쓸까 합니다. 제가 읽은 책 위주로 책 소개하고 책 링크를 걸까 합니다. 그냥 소식지죠 ㅎㅎ 매체가 블로그만 있는 것은 아닌데 글을 써놓으면 어느정도 커버를 칠 수 있을까 싶습니다. 진짜 세상은 점점 좋아지는데 더 바빠지는 느낌이 드는 건 왜일까요? 분명 편해지려고 발전하는 것 같은데 시간은 점점 없어지는 것 같네요. 읽은 책 하나씩 채우다 보면 제가 일일히 소개하지 않아도 되고 블로그 링크만 보내면 조금이나마 시간이 아껴질려나요. 기록해두면 여러모로 좋기도 하고 요즘은 책링크를 올릴 때 쿠팡 파트너스나 텐핑으로 빌려서 하던데 리뷰글에 책링크 올려두면 돈이 얼마되지는 않지만 시간에 대한 보상을 받을 수 있..
rstudio 패키지 설치에 대한 내용입니다.패키지 설치는 rstudio에 googledrive 패키지를 설치하는 예제로 보여드리도록 하겠습니다.googledrive를 연동해 놓으면 외부에서 다운받은 데이터를 googledrive에 저장하고 rstudio에 바로 데이터로써 불러올 수 있어서 굉장히 편합니다.물론 github에서도 데이터를 다룰 수 있지만 외부사이트에서 가져온 것을 googledrive에 저장했다가 처리를 한 후 넣어놓거나 전체 프로젝트용의 데이터는 github에 임시데이터는 googledrive에 넣으면 구분이 되서 편리합니다.패키지 설치에 임하기 전에 반드시 관리자 모드로 실행해야합니다. 관리자 모드가 아니면 아래와 같은 오류가 뜹니다. rstudio packages(googledriv..
sympy를 이용해 그래프 그리는 방법입니다. 데이터의 값에 따른 그래프를 그리는 게 아니라 함수식 자체를 그리려고 한다면 sympy를 사용하면 그릴 수 있습니다.sympy의 내장으로 가지고 있는 plot 함수를 이용하면 됩니다. 편의를 위해 sympy를 sy로 줄이고 sympy의 나머지 함수를 모두 불러옵니다. from sympy import * import sympy as sy 함수 그래프 그리기 함수 1개 $x^2$ 를 그려보겠습니다. x = sy.symbols('x') fx = x^2 plot(fx) 함수 여러개 두 가지 함수를 동시에 그려보겠습니다. plot 안에 넣어서 한꺼번에 그릴 수 있는데 색깔이 같게 나오는 문제가 생깁니다. plot(fx,x**3) 색깔을 바꾸려면 line_color를 ..
R studio를 github에 연동하는 방법입니다. 준비되어 있는 상태는 세가지 입니다. github에 가입(https://github.com/) r studio 설치(https://seong6496.tistory.com/253) git 설치(https://www.git-scm.com/) 가입이 안 됐거나 설치가 안 됐으면 다음 링크에서 설치하시기 바랍니다. r studio는 다운로드 경로가 약간 복잡해서 r studio 설치과정을 쓴 포스팅을 링크로 걸어놓았습니다. 모든 준비가 되었으면 연동을 시작하겠습니다. 엄청나게 쉽습니다. github repository 생성 github에서 새로운 repository를 생성합니다. 저는 r_practice 라는 이름으로 만들었습니다. r studio와 git ..
Rstudio 파일 관리 방법입니다. Rstudio에서의 스크립트 파일 저장, 불러오기 등 기초적인 방법, 프로젝트 생성하고 관리하는 방법에 대한 내용입니다. 큰 기조는 Visual Studio와 비슷한 것 같은데 글로 정리가 되어 있으면 좋을 것 같다는 생각에 포스팅으로 남깁니다. 스크립트 관리 새 파일 열기 Rstudio의 위에 보면 File 밑에 +종이 모양이 있습니다. 여기서 R script를 누르면 코드를 쓸 수 있는 편집기가 나옵니다. 또는 단축키 Ctrl+Shift+N을 눌러도 스크립트가 생성됩니다. 저장하기 저장하려면 Ctrl+S 를 누르거나 아래 그림같이 저장버튼을 누릅니다. 코드 실행하기 처음 R을 접하시는 분이라면 할 수 있는 코드가 거의 없을겁니다. print('Hello world..
요즘 개발자들이 많이 사용하고 있는 Github 블로그 만드는 방법입니다. 장단점이 확연한데 본인의 성향에 맞게 사용할지를 결정하면 될 것 같습니다. 뭐든 그렇지만 필요하면 만들어 쓰면 그만입니다. 장점(요약 : 내 맘대로다) 1. 자유도가 엄청나게 높습니다. 블로그의 모든 것을 내 마음대로 바꿀 수 있다는 것이 큰 장점입니다.티스토리도 물론 자유도가 높은 편이지만 github는 더욱 세세한 부분까지도 바꿀 수 있습니다. 디자인을 중시한다면 github를 이용한 블로그를 쓰는 것이 좋을 것 같습니다. 2. 오직 나에게만 집중할 수 있습니다. 일단 만들어 놓으면 이거 해야하고 저거 신경쓸 필요가 없다는 뜻입니다. 구독자 신경 안써도 되고 이웃 품앗이 안해도 됩니다. 그런 기능이 없으니깐요. 오직 본인의 의..
R studio 초기설정입니다. 이건 필수적인 건 아니지만 보통 많이 하는 방식이므로 참고용으로 보시면 좋을 것 같습니다. R studio 초기설정 이제 설정을 몇가지 해봅시다. 가장 기본적인 부분만 설명하겠습니다. script 추가 R script를 추가합니다. console은 한 코드를 입력하고 출력하는 방식이라서 코드 정리가 안 됩니다. 다행히 R은 script를 제공합니다. 아래 그림의 빨간박스로 표시된 R script를 누르면 메모장같은 창이 뜹니다. 명령을 입력하고 Ctrl+Enter를 하면 Console 창에 결과가 나오게 됩니다. 글자와 테마 바꾸기 Tools -> Global option 을 클릭합니다. Apperance 탭으로 이동하면 글자크기, 글자폰트, 테마를 바꿀 수 있습니다. G..
윈도우에서 ruby 설치하는 방법입니다. 주로 github에 블로그 만들려는 용도로 설치를 하기 때문에 거기에 맞게 설치를 32bit 기준으로 했습니다. 1.루비 설치파일을 받습니다. 다운로드 페이지 : https://rubyinstaller.org/downloads/ Downloads Which version to download? If you don’t know what version to install and you’re getting started with Ruby, we recommend that you use the Ruby+Devkit 3.1.X (x64) installer. It provides the biggest number of compatible gems and installs th..
우분투에서 R과 R studio 설치하는 방법입니다. R 설치 다운로드 페이지에 들어가 Ubuntu에 들어가면 여러 명령어가 나옵니다. 다운로드 페이지 : https://ftp.harukasan.org/CRAN/ 들어가보면 설치 파일은 없고 왠 명령어만 잔뜩 있습니다. 우분투 터미널에서 sudo를 앞에 치고 아래의 명령을 하나씩 입력해야만 설치를 진행할 수 있습니다. 우분투를 실행해 터미널로 갑니다. 터미널은 우분투 화면 왼쪽 아래 바둑판 모양을 클릭해 터미널을 클릭하면 됩니다. 터미널에서 아래 명령을 하나씩 입력해 실행시킵니다. #update indicses sudo apt update -qq #install dirnmgr sudo apt install --no-install-recommends sof..
블로그 운영하는 동안 파이썬에 대한 글을 썼습니다. 특히, 데이터분석이 주테마다보니 Pandas에 대한 내용을 많이 포스팅했습니다. 이제는 R과 병행하는것도 괜찮겠다 싶어서 R을 좀 시작해볼까 합니다. 파이썬과는 큰 차이는 없지만 아무래도 R이 통계적 기법과 머신러닝에 한해서는 파이썬보다는 가볍게 유명한 기법을 간단히 연습해볼 수 있어서 좋은 것 같습니다. R 소개 R은 1993년 뉴질랜드 오클랜드 대학교 통계학과 교수들이 개발한 오픈소스 분석용 프로그래밍 언어입니다. 통계에 초점을 맞춘 언어이기 때문에 통계기법이나 머신러닝과 딥러닝, 인공지능에 대한 패키지가 잘 되어 있어 데이터분석에 특화된 언어라고 할 수 있습니다. 최근 파이썬이 급부상하고 있지만 아직까지는 학계의 논문은 R을 이용해 실험을 하고 있..