파이썬 웹 크롤링에서 텍스트만 추출하는 방법 알려주세요!

조회수 1204회

파이썬 selenium과 beautifulsoup을 이용해서 텍스트를 크롤링 중 입니다.

# 해당 사이트 접속
url = 'http://www.yes24.com/Product/Goods/101773374'
driver.get(url)
time.sleep(1)

# 줄거리 부분을 크롤링
book_story = soup.find('textarea', {'class': 'txtContentText'})
print(book_story.text.strip())

이미지

이렇게 b, br 태그들이 같이 출력됩니다. 그냥 텍스트만 출력하려면 어떻게 해야하나요??

사이트 주소 : http://www.yes24.com/Product/Goods/101773374

  • (•́ ✖ •̀)
    알 수 없는 사용자

답변을 하려면 로그인이 필요합니다.

프로그래머스 커뮤니티는 개발자들을 위한 Q&A 서비스입니다. 로그인해야 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)