R에서 데이터 타입 변경하기R에서 데이터 타입을 변경하는 방법입니다. 데이터 분석 과정에서 데이터 타입을 올바르게 지정하는 것은 매우 중요합니다. 데이터 타입이 올바르지 않으면 원하는 분석 결과를 얻기 어렵기 때문이죠. 그럼, R에서 데이터 타입을 변경하는 다양한 방법을 함께 살펴보겠습니다.1. 기본 데이터 타입R에는 여러 가지 기본 데이터 타입이 있습니다. 주요 데이터 타입은 다음과 같습니다:numeric: 실수형 데이터 (예: 1.5, 2.7)integer: 정수형 데이터 (예: 1, 2, 3)character: 문자열 데이터 (예: "a", "hello")factor: 범주형 데이터 (예: "male", "female")logical: 논리형 데이터 (예: TRUE, FALSE)2. 데이터 타입 확..
빅데이터란?오늘은 우리가 자주 듣게 되는 "빅데이터"라는 용어에 대해 이야기해보려고 합니다. 4차혁명이 시작되면서 빅데이터란 용어가 급부상하고 있는데요. 빅데이터가 정확히 무엇을 의미하는지, 그리고 왜 중요한지 알아보겠습니다.Pixabay로부터 입수된 Gerd Altmann님의 이미지 입니다. 빅데이터 정의빅데이터, 말만 들어도 왠지 거대한 무언가를 떠올리게 되지 않나요?빅데이터란 말 그대로 엄청나게 큰 데이터셋을 뜻합니다. 하지만 단순히 데이터가 크다고 빅데이터의 진정한 의미로 받아들이지 않습니다.기본적으로 빅데이터는 다음의 3V로 설명될 수 있습니다. 미국의 IT 자문기관인 가트너그룹에서 말한 3V는 다음과 같습니다.Volume (양): 빅데이터의 첫 번째 특징은 방대한 양입니다. 매일 전 세계에서 ..
옵시디언 표만들기옵시디언은 마크다운 기반이라서 마크다운 표만들기 기능을 이용하면 옵시디언 표만들기는 다한겁니다. 하지만 너무 불편합니다. 불편함을 없애기 위해 하나씩 해결을 하는 마음으로 좋은 플러그인 있는지 살펴봤습니다.마크다운 활용먼저 가장 기본적인 마크다운을 이용하는 방법입니다.세로 바(|)를 이용해서 합니다. 헤더 밑에는 --- 으로 막아주어야 하고 행 갯수만큼 만들어줍니다.| 이름 | 나이 || --- | --- | #헤더 만들기| 홍길동 | 17 | #내용 만들기| 김철수 | 24 |완성본은 아래와 같습니다. 참고로 편집모드에서 표 시작 바로 위에서 엔터를 한번 눌러주시면 표로 인식됩니다.이름나이홍길동17김철수24 굉장히 원시적인 방..
값 뽑아내기 자신이 원하는 값을 범위에서 추출하는 방법입니다. 예를 들어, 주소록에서 20세 이상 여자 또는 남자인 경우의 데이터를 가져오거나 키가 170이상인 경우의 데이터를 가져올 수 있습니다. 어쨋든 조건을 달면 거기에 맞는 데이터만 출력해줍니다. 잘 이용하면 자동화도 가능합니다. FILTER 사용하기 FILTER는 다음과 같이 씁니다. =FILTER(범위, 조건1, 조건2, ...) 범위를 정하고 조건을 정하면 그만입니다. 간단한 예제(조건에 맞는 데이터가져오기) 간단한 예제를 만들었습니다. 조건에 맞는 경우 가져오게 합니다. 위에서 언급했던 것과 비슷하게 30세이상 이면서 여자인 경우인 데이터만 가져오겠습니다. =FILTER(A1:D21,B1:B21>=30,C1:C21="여") 함수를 조건으로 ..
리스트를 복사하는 이유 파이썬으로 데이터분석에서 가장 중요한게 데이터입니다. 데이터를 보존해놔야 다른 모델을 쓰거나 다른 아이디어를 적용할 수 있기 때문에 반드시 복사를 해놔야합니다. 가끔 리스트로서 데이터를 가지고 있을 때가 있는데 다른것도 마찬가지겠지만 코드 진행을 하다보면 리스트 내용이 바뀌면서(다중 참조) 어그러지기 때문에 원본 구분을 잘 해놓는게 중요합니다. 리스트 복사하기 슬라이싱을 사용한 복사 보통 copy 매쏘드를 쓰는데 슬라이싱을 통해서도 할 수 있습니다. 전체를 슬라이싱하면 복사본으로 인식합니다. original_list = [1,2,3,4,5] copied_list = original_list[:] copy를 이용한 복사 copy 매쏘드를 이용한 방법입니다. 리스트 뒤에 copy()를..
구글시트는 동기화가 가능하면서 스프레드시트를 할 수 있는 툴인데요. 이미 아시는 분은 다 쓰고 있을거라 생각합니다. 마이크로소프트의 엑셀과는 다르게 구글시트만의 장점이 있는데 그 중 하나가 목록단추입니다. 목록단추를 만들어서 좀 더 작업을 손쉽게 할 수 있습니다. 목록단추(드롭다운) 만들기 목록단추를 만드는 방법은 아주 간단합니다.드롭다운에 들어가면 되는데요. 목록단추를 만들 자리에서 오른쪽 마우스 클릭을 하면 드롭다운이라고 나옵니다. 드롭다운을 들어가면 오른쪽에 항목을 쓸 수 있는 란이 나옵니다. 원하는 이름으로 항목을 정합니다. 해당시트는 밑 화살표 방향으로 표시가 바뀌게 되는데 이를 눌러보면 다음과 같이 항목을 정할 수 있게 됩니다. 삭제를 하고 싶다면 아래에 규칙 삭제를 눌러줍니다. 반복작업을 한..
판다스로 Json 불러오기 Json(JavaScript Object Notation) 은 Javascript 객체 문법을 따르는 문자 기반의 데이터이입니다. 네트워크를 통해 전송할 때 유용한 면이 많기 때문에 다양한 곳에서 쉽게 볼 수 있는 포맷입니다. 데이터를 크롤링하거나 다른 외부에서 가져올 때 Json 객체로 변환되어서 가져오는 경우가 많은데 파이썬에서 json 모듈을 이용해 json 파일을 열 수도 있지만 보기 불편합니다. 가독성을 위해 판다스에서 Json파일을 저장, 불러올 수 있습니다. pd.read_json() 함수를 사용하여 JSON 파일이나 문자열을 데이터프레임으로 변환할 수 있습니다. 아래는 JSON 데이터를 판다스 데이터프레임으로 불러오는 예시 코드입니다: JSON 파일을 데이터프레임..
Json 파일 만들기 Json은 자바스크립트의 객체 표기법으로부터 파생된 부분 집합으로 몇 가지 표기법에 의해 구조가 구성됩니다. Json 데이터는 '키 : 값' 의 딕셔너리 형태로 이루어집니다. 콜론으로 구분됩니다. 여러 '키:값'은 쉼표(,)로 데이터를 구분합니다. 객체(object)는 중괄호({})로 표현합니다. 배열(array)은 대괄호([])로 표현합니다. 예를 들어, 어떤 사람의 정보를 객체로 json으로 표현하다고 하면 다음과 같이 할 수 있습니다. { "name": "John", "age": 30, "city": "New York" } 대괄호로 둘러쌓인 값들은 주로 리스트로 표현되는데 이 배열을 쉼표로 구분해서 표현합니다. { "name": "John", "age": 30, "city": ..
시트만 다른데 매번 다시 불러야하나? 판다스에서 엑셀시트를 불러오는 방법으로 보통 read_excel(sheet_name = '시트이름')을 쓰게 되는데 이러면 시트를 부를 때마다 excel을 부르고서 sheet_name을 다르게 해서 엑셀파일 자체를 다시 읽게 됩니다. 즉, 시간소비가 많다는 것이죠. (이런 시간낭비...) 그래서 엑셀 파일을 객체로 만드는 방법을 알아냈습니다. 판다스 내에 엑셀 파일을 객체로 불러와서 시트만 불러내는 방식을 사용할 수 있더라고요. 이 방식을 사용하면 엑셀파일은 불러와있는 상태에서 시트만 선택적으로 꺼내쓰는 방식으로 바뀝니다. 시간도 절약하고 시트관리가 좀 더 용이해집니다. 엑셀 파일 객체로 불러오기(ExcelFile) 판다스에 ExcelFile이라는 메쏘드가 있습니다...