파이썬 라이브러리 뷰티플수프 문서 네이버 예시

Posted by 슈퍼너드 리보
2020. 4. 16. 11:38 프로그래밍/파이썬
반응형

파이썬 라이브러리 뷰티플수프 문서가 영어로 되어있어서 보기가 어렵더라고요. 그래서 네이버를 이용해 뷰티플수프 문서 예제를 만들어보았습니다. 뷰티플수프 어떻게 사용하는지 모르는분들 많은 도움 될겁니다. 

사전작업으로 rquests와 bs4를 가상환경에 설치해놓아야합니다. 그리고 아톰이나 vs코드를 키고, 아래 코드를 입력해봅시다.

1
2
3
4
5
6
7
8
9
10
11
import requests
 
from bs4 import BeautifulSoup
 
 
 
req = requests.get('https://www.naver.com/')
 
url = req.text
 
soup = BeautifulSoup(url, 'html.parser')
cs

print(soup)해보면 네이버의 데이터 덩어리를 뽑은걸 확인 할 수 있습니다. 이 코드를 바탕으로 뷰티플 수프 문서에 나온대로 설명해보겠습니다. 그런데 이 코드가 몇천줄 되기 때문에 에디터에서 이걸 쭈욱 보는건 비효율적이기 때문에 크롬에서 페이지소스 보기를 하여 코드를 보면서 진행하세요.

이제 뷰티플수프 문서에 나온대로 본격적으로 뷰티플수프를 써볼까요?

먼저 soup.title입니다. <title>NAVER</title> 뜨네요. 이런식으로 문서에 나와있는 뷰티플수프 선택자들을 이용해보는겁니다.

이런식으로 a태그에서 나온 모든 url을 찾을 수 있습니다. 어려울거 없어요 공식문서에 나와있는대로 따라 할 뿐입니다.

이렇게 텍스트만 뽑아올 수 있고요. 무엇보다 css선택자란놈이 굉장한데요. 아래 css선택자를 전부 습득하면 파이썬으로 파싱 못하는건 없을겁니다. 앞으로 파싱 강좌들에서 이것을 주로 파싱할겁니다.


반응형