문서를 주로 PDF 형식으로 주고받는데 PDF는 수정이 불가합니다. 하지만 수정이 불가능한 PDF 파일의 내용은 가져올 수 있습니다. 사실 워드에 쓰면 되는 것인데 파이썬을 쓰면 이런 일을 조금이나마 줄일 수 있을 것 같습니다. PDF 읽고 추출하기 PDF 파일을 읽고 데이터를 추출하기 위해 파이썬에서는 PyPDF2, pdfminer.six, textract 등의 라이브러리를 활용할 수 있습니다. 이러한 라이브러리들은 PDF 파일을 열어서 내용을 읽고 특정한 텍스트나 이미지 데이터를 추출할 수 있는 기능을 제공합니다. 파이썬 코드를 사용하여 PDF 파일을 열고 원하는 데이터를 추출하는 작업은 데이터 분석, 텍스트 처리, 문서 요약 등 다양한 분야에서 유용하게 활용될 수 있습니다. PyPDF2 설치 pyp..
Rstudio 파일 관리 방법입니다. Rstudio에서의 스크립트 파일 저장, 불러오기 등 기초적인 방법, 프로젝트 생성하고 관리하는 방법에 대한 내용입니다. 큰 기조는 Visual Studio와 비슷한 것 같은데 글로 정리가 되어 있으면 좋을 것 같다는 생각에 포스팅으로 남깁니다. 스크립트 관리 새 파일 열기 Rstudio의 위에 보면 File 밑에 +종이 모양이 있습니다. 여기서 R script를 누르면 코드를 쓸 수 있는 편집기가 나옵니다. 또는 단축키 Ctrl+Shift+N을 눌러도 스크립트가 생성됩니다. 저장하기 저장하려면 Ctrl+S 를 누르거나 아래 그림같이 저장버튼을 누릅니다. 코드 실행하기 처음 R을 접하시는 분이라면 할 수 있는 코드가 거의 없을겁니다. print('Hello world..