Python 또는 R로 Gmarket 등의 오픈마켓의 구매 후기를 파싱 / 크롤링 하는 코드를 작성하는 방법

조회수 1697회

Python 또는 R로 Gmarket 등의 오픈마켓의 구매 후기를 파싱 / 크롤링 하는 코드를 작성하는 방법에 대해 알고 싶습니다.

R에서 쿠팡의 제품리스트를 뽑을때 이런식으로 했었는데, 지마켓은 어떻게 할 수있을까요? 각 제품에 대한 상품평을 가능하다면 별점도 함께 수집하고싶습니다.

library(rvest)
library(httr)
url=''
response=GET(url)
htxt=read_html(response)

comments=html_nodes(htxt,'div.name')
html_text(comments)

comments=repair_encoding(html_text(comments))
comments <-gsub("\n","",comments)
comments
writeLines(comments,"comments.txt")


  • (•́ ✖ •̀)
    알 수 없는 사용자
  • 그래서 질문은 무엇인가요? 코딩을 하는 방법? 그건 책을 보셔야 합니다. 정영훈 2018.4.26 14:03
  • 책이나 참고할만한 웹사이트를 알고싶습니다 알 수 없는 사용자 2018.4.26 15:25

1 답변

  • 질문 사항을 구현하기 위한 스킬셋은 아래와 같습니다.

    HTTP(S)
    HTML
    JAVASCRIPT
    R 혹은 PYTHON
    

    통신 프로토콜인 HTTP(S)을 잘 알아야 합니다.

    표현언어인 HTML 은 당연하겠구요.

    요새는 AJAX로 동적인 기능을 많이 사용하므로 JAVASCRIPT 를 모르면 불가능에 가깝습니다.

    그다음 R, 혹은 PYTHON 을 익히면 됩니다.

    여기에 SpiderMonkey 가 필요할 수도 있고 selenium 이 필요할 수 있습니다.

    • 뷰티플수프 추가요~ 광자 2018.5.2 16:11

답변을 하려면 로그인이 필요합니다.

프로그래머스 커뮤니티는 개발자들을 위한 Q&A 서비스입니다. 로그인해야 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)