[python]네이버 실시간 검색어 파싱
네이버 실시간 검색어 파싱 어떻게 하냐고 물어보시는 분들 많더라구요. 그래서 오늘은 한번 네이버 실시간 검색어 파싱(cf.다른 말로 웹크롤링) 파이썬으로 어떻게 하는지 알아보는 시간을 갖겠습니다.
아나콘다를 실행하고, 두가지 코드를 입력해줍시다. 하나는 pip install bs4, pip install request 입니다. bs4는 실질적으로 파싱을 가능케 해주는 마법의 라이브러리이고, request는 인터넷 통신 할 때 쓰는 라이브러리입니다. 아 참 가상 환경은 parsing이라고 새롭게 만들어주고 거기에다가 해주세요.
activate parsing 해주시고, 이제 라이브러리들을 설치하면 됩니다.
이제 기본저인 환경은 셋팅 됐습니다. 본격적으로 파싱하러 가볼까요? 이제 크롬으로 네이버를 실행하고, F12키로 우리가 따올 코드를 파악해봅시다.
한번 훑어보니 1.개표현황 2.선거결과 3.김부겸 식으로 실시간 검색어가 나오는데 ah_k라는 코드가 그 검색어들과 함께 번갈아 나오는걸 확인 할 수 있습니다. 게임 끝났네요. 이 코드들만 있으면 뷰티플수프를 쓸 수 있습니다. 뷰티플수프의 공식문서에는 이같은 태그가 나올 경우 soup.select를 사용하면 됩니다. 아래 코드 적어놓을테니 따라해보세요.
'프로그래밍 > 파이썬' 카테고리의 다른 글
[python]핸드폰으로 커뮤니티 정보글 알림을 받아보기 + 파이썬 초간략 소개 (0) | 2020.04.30 |
---|---|
파이썬 강좌 아톰 및 아나콘다 설치 방법 안내 (0) | 2020.04.30 |
파이썬 라이브러리 뷰티플수프 문서 네이버 예시 (1) | 2020.04.16 |
[python]테트리스 만들기 코드 (2) | 2020.04.15 |
아톰 파일 경로 힘들게 찾지 말고 한번에 알아봐요 (0) | 2020.04.15 |