find() 함수
각각 태그의 id데이터를 추출할 수 있습니다.
실행화면
코드
from bs4 import BeautifulSoup
beautifulSoup import
html="""
<html>
<body>
<h1 id="title"> BeautifulSoup 사용 방법</h1>
<p id="subTitle">스크레이핑 연습하기</p>
<p>원하는 데이터 추출하기</p>
</body>
</html>
"""
더미데이터 삽입
soup = BeautifulSoup(html,'html.parser')
html.parser를 이용해 태그를 soup에 저장
title = soup.find(id="title")
subTitle = soup.find(id="subTitle")
p = soup.find(id="subTitle").next_sibling.next_sibling
print("title: "+ title.string)
print("subTitle: "+ subTitle.string)
print("p: "+ p.string)
title,subTitle에 id가 title,subTitle인 태그 내용 저장
p에 subTitle.next_sibling을 이용해 저장
.string 을 사용해 출력
'언어 > 파이썬' 카테고리의 다른 글
[python] html 스크레이핑 실습예제 (기상청 rss파일의 원하는 태그내용 가져오기) (0) | 2020.11.04 |
---|---|
[python] 파이썬 beautifulsoup로 데이터 분석(추출)하기#3 ( find_all 함수 사용 ) (0) | 2020.11.04 |
[python] 파이썬 beautifulsoup로 데이터 분석(추출)하기#1 (0) | 2020.11.04 |
[python] 파이썬 빅데이터 기초 ( 웹사이트에 접근해서 사진 다운받기 ) (0) | 2020.11.03 |
[python] 파이썬 아나콘다 설치 (0) | 2020.11.03 |