파이썬 웹 크롤링에서 텍스트만 추출하는 방법 알려주세요!

Question

파이썬 웹 크롤링에서 텍스트만 추출하는 방법 알려주세요!

조회수 1204회

python

json

0

싫어요

파이썬 selenium과 beautifulsoup을 이용해서 텍스트를 크롤링 중 입니다.

# 해당 사이트 접속
url = 'http://www.yes24.com/Product/Goods/101773374'
driver.get(url)
time.sleep(1)

# 줄거리 부분을 크롤링
book_story = soup.find('textarea', {'class': 'txtContentText'})
print(book_story.text.strip())

이렇게 b, br 태그들이 같이 출력됩니다. 그냥 텍스트만 출력하려면 어떻게 해야하나요??

사이트 주소 : http://www.yes24.com/Product/Goods/101773374

(•́ ✖ •̀)
알 수 없는 사용자

https://stackoverflow.com/a/52064964 엽토군 2021.6.1 11:35

파이썬 웹 크롤링에서 텍스트만 추출하는 방법 알려주세요!

조회수 1204회

python

json

0

(•́ ✖ •̀)알 수 없는 사용자

댓글 입력

답변을 하려면 로그인이 필요합니다.

(•́ ✖ •̀)
알 수 없는 사용자