우분투에서 셀레니움 한글 깨짐 해결
- Python/웹크롤링
- 2023. 3. 15.
반응형
반응형
셀레니움으로 크롬 드라이브를 켜보면 아래와 같이 한글이 무지막지하게 깨지는 걸 볼 수 있습니다.(쿠팡에 아무거나 들어가봤습니다)
원인은 리눅스에 한글팩이 없는 것!
한글팩을 설치해주어야 합니다. 물론 한글 설정도 해야하고요.
우분투 리눅스 한글 언어팩 설치
한글 언어팩 설치
한글 언어팩을 설치합니다.
sudo apt-get install language-pack-ko
만약 unable to locate package 오류가 뜬다면 다음 포스팅을 참고해주시기 바랍니다.
[우분투] unable to locate package 해결방법
locale-gen을 통해 Locale 언어 설정
sudo locale-gen ko_KR.UTF-8
한글로 설정
dpkg-reconfigure 에서 ko_KR.UTF-8 UTF-8 을 선택해줍니다.
별(*)표시가 되어있다면 설정된 겁니다.
sudo dpkg-reconfigure locales
디폴트도 바꿔줍니다.
ko_KR.UTF-8 선택
update-locale로 설정 업데이트
sudo update-locale LANG=ko_KR.UTF-8 LC_MESSAGES=POSIX
vi를 켜보면 한글로 바뀐것을 알 수 있습니다.
폰트
여기까지는 리눅스 안에서는 한글 호환이 됩니다.
크롬 드라이버에서도 가능하려면 몇가지 한글 폰트를 설치해줘야 합니다.
터미널에서 다음 경로에서 /usr/share/fonts 아래 명령어를 쳐줍니다.
unfonts, baekmuk, nanum 세가지폰트는 따로 설정할 필요 없고 바로 쓸 수 있습니다.
# unfonts
$ sudo apt-get install fonts-unfonts-core fonts-unfonts-extra
# baekmuk
$ sudo apt-get install fonts-baekmuk
#nanum
$ sudo apt-get install fonts-nanum fonts-nanum-coding fonts-nanum-extra
설치가 완료되면 다시 시작합니다.
$ reboot
reboot 안되는 분들은 다 끄고 다시 시작합니다.
끝
아래와 같이 크롬 드라이브에서도 한글로 나오게 되었습니다.
'Python > 웹크롤링' 카테고리의 다른 글
[파이썬] newspaper 모듈로 뉴스 스크래핑하기 (0) | 2023.04.13 |
---|---|
파이썬으로 RSS를 통한 뉴스기사 제목, 링크 가져오기 (0) | 2023.03.30 |
[파이썬] chrome-driver 설치 안하고 사용하기 (0) | 2022.08.31 |
[python] dict형식의 string dict으로 변환(json 활용) (0) | 2022.04.21 |
[Python] FinanceDataReader로 주식데이터 가져오기 (0) | 2021.08.20 |