파이썬으로 자바스크립트를 이용한 페이지변경되는 웹사이트 크롤링

조회수 3422회

파이썬을 조금 배운 초짜입니다ㅠㅠ 웹페이지가 자바스크립트를 이용해서 페이지를 변경하기때문에 URL이 변경되지 않고 페이지가 변경됩니다. 파이썬으로 크롤링을 할려고 알아봤더니 URL을 기본으로 진행을 하더군요 이러한 경우에는 어떻게 해야하나요 이런식으로 작성이 되어있네요

//<a href="javascript:OnPage(11)">11</a>
  • (•́ ✖ •̀)
    알 수 없는 사용자

1 답변

  • javascript 는 VM에 의해 동적으로 실행이 되는 환경입니다.

    즉 spider monkey 같은 javascript 엔진을 사용해서 별도 처리를 해야 합니다.

    그러나 그렇게 할 경우 너무 고려할게 많으므로 성능을 고려하지 않을거라면 selenium 을 이용해서 브라우져를 이용해서 크롤링을 할 수 있습니다.

    selenium 과 PhantomJS 조합을 추천합니다.

답변을 하려면 로그인이 필요합니다.

프로그래머스 커뮤니티는 개발자들을 위한 Q&A 서비스입니다. 로그인해야 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)