html을 통째로 가져오는 크롤러를 만들고 있는데요 (질문...)
조회수 502회
하나의 csv 파일에 담겨진 수천개의 url 각각의 페이지 내용(이미지, 텍스트)에 대해 크롤러를 만들고 있습니다. 아직 초보라서 많은 어려움이 있다 보니 여기에 질문 드리게 되었습니다.
하나의 url에 있는 html을 일단 몽땅 가져온 다음 거기서 텍스트와 이미지를 구분해서 저장하는 크롤러를 만드려고 합니다.
어떤 방향으로 접근하면 좋을지 큰 틀부터 생각이 잘 안나는거 같네요. 고수님들의 도움이 필요합니다. 미리 감사합니다.
-
(•́ ✖ •̀)
알 수 없는 사용자
댓글 입력