파이썬 웹 크롤링에서 텍스트만 추출하는 방법 알려주세요!
조회수 1204회
파이썬 selenium과 beautifulsoup을 이용해서 텍스트를 크롤링 중 입니다.
# 해당 사이트 접속
url = 'http://www.yes24.com/Product/Goods/101773374'
driver.get(url)
time.sleep(1)
# 줄거리 부분을 크롤링
book_story = soup.find('textarea', {'class': 'txtContentText'})
print(book_story.text.strip())
이렇게 b, br 태그들이 같이 출력됩니다. 그냥 텍스트만 출력하려면 어떻게 해야하나요??
-
(•́ ✖ •̀)
알 수 없는 사용자
댓글 입력