find_all
원하는 태그를 전부 가져올 수 있습니다.
실행 화면
코드
from bs4 import BeautifulSoup
BeautifulSoup를 import
html="""
<html>
<body>
<ul>
<li><a href="http://www.naver.com">네이버</a></li>
<li><a href="http://www.daum.net">다음</a></li>
</ul>
</body>
</html>
"""
더미데이터 삽입
soup = BeautifulSoup(html, 'html.parser')
태그내용 soup에 저장
links = soup.find_all("a")
모든<a>태그 links에 저장
for a in links:
href = a.attrs['href']
text = a.string
print(text,">",href)
attrs를 사용해 href속성값 href에 저장
string을 사용해 href의 값 저장 (네이버, 다음)
출력
'언어 > 파이썬' 카테고리의 다른 글
[python] CSS 선택자로 스크레이핑 (0) | 2020.11.04 |
---|---|
[python] html 스크레이핑 실습예제 (기상청 rss파일의 원하는 태그내용 가져오기) (0) | 2020.11.04 |
[python] 파이썬 beautifulsoup로 데이터 분석(추출)하기#2 ( find 함수 사용 ) (0) | 2020.11.04 |
[python] 파이썬 beautifulsoup로 데이터 분석(추출)하기#1 (0) | 2020.11.04 |
[python] 파이썬 빅데이터 기초 ( 웹사이트에 접근해서 사진 다운받기 ) (0) | 2020.11.03 |