네이버 영화 줄거리 크롤링

조회수 610회

영화 추천 시스템을 만들어보고 싶어서 데이터를 모으고자 크롤링을 하고 있는데

줄거리에서 막힙니다.

줄거리가 다 안되는게 아니라 일부 영화에 대해서 안됩니다.

또 아예 에러가 뜨는것도 아닙니다. 대다수 영화들은 잘 되기는 합니다.

​ 네이버 영화 줄거리는 class="con_tx"인 p태그에 내용들이 저장되어 있습니다.

대다수 영화들은 bs.find("p", {"class" : "con_tx"})로 하면 지정한 p태그가 모두 잘 출력이 됩니다.

하지만 일부 영화들 그린 북, 가버니움 등의 영화는 p태그 전부가 아닌, 닫힌 태그 주변의 일부만 출력이 됩니다.

왜 그런지 모르겠습니다.

이에 대해 네이버 카페에도 질문을 상세히 올렸습니다. 자세한 사항은 아래 링크로 확인하실 수 있습니다.

진짜 도와주시면 너무 감사하겠습니다.

https://cafe.naver.com/hacosa/285574

답변을 하려면 로그인이 필요합니다.

프로그래머스 커뮤니티는 개발자들을 위한 Q&A 서비스입니다. 로그인해야 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)