웹데이터 자동 수집 코드 짜기

조회수 1647회

안녕하세요 데이터수집관련해서 질문을 드릴 곳이 없어서 여기에 질문글을 올립니다.

학교 수업을 들으면서 데이터사이언스 관련 프로젝트를 진행해야 합니다

제가 수집하고 싶은 데이터는 NBA관련해서 기록들을 저장하는 것인데, 매일 업데이트 되는 NBA리그의 기록들을 게임별로 기록들을 저장하고 싶습니다. 이를 통해서 선수별로 그리고 팀별로 데이터분석을 해서 승부예측을 하는 것이 프로젝트 목표입니다. 예를들어 http://www.espn.com/nba/boxscore?gameId=400974443 페이지처럼 한경기에 대한 기록들을 데이터로 쌓고 싶습니다.

데이터수집관련해서 찾아보니 크롤링이나 스크래핑이 두가지가 있더군요. 근데 제가 제대로 다룰 줄 아는 프로그래밍언어가 없습니다. 파이썬을 배우고는 있으나 정말 기초적인 것을 배우고 있어서 유튜브에서 크롤링관련 강의를 들으니 도저히 못따라 가겠더군요.

  • ESPN사이트에서 업데이트되는 경기기록들을 자동으로 저장하는 코드를 짜고 싶습니다. 크롤링같은 경우에는 자세히는 모르겠으니 넷상의 모든 정보를 긁어 오는것 같은데 저는 한 사이트에 업그레이드 되는 것만 데이터수집을 하고 싶거든요. 이런 경우 어떻게 하는게 제일 좋을까요?
  • (•́ ✖ •̀)
    알 수 없는 사용자
  • 답이 정해져 있는 질문이네요. 파이썬을 익히세요. 정영훈 2017.10.23 19:41
  • Scrapy를 사용하세요! dbwodlf3 2017.10.24 17:57

답변을 하려면 로그인이 필요합니다.

프로그래머스 커뮤니티는 개발자들을 위한 Q&A 서비스입니다. 로그인해야 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)