html 크롤링
조회수 417회
마지막 부분 숫자를 바꿔서 생성한 url들에서 단어와 뜻을 crawling하고 싶은데, 숫자 시작부분이 000이어서 range 설정을 어떻게 해야 할지 모르겠습니다. 혹시 방법이 있을까요?
-
(•́ ✖ •̀)
알 수 없는 사용자
1 답변
-
>>> for i in range(8211, 8219): print("%09d"%i) ... 000008211 000008212 000008213 000008214 000008215 000008216 000008217 000008218
- 9 : 9자리를 차지하도록,
- 0 : 앞자리를 0으로 채우도록,
- for i in range(127,189883):url = base_url.format("%09d"%i) doc = urllib.request.urlopen(url) 알 수 없는 사용자 2019.11.23 08:36
- 제가 이렇게 작성했는데 이 중에서 존재하는 페이지만 추출하려면 if구문을 어떻게 작성해야 하나요? 알 수 없는 사용자 2019.11.23 08:37
- 그런건 못하죠 일일이 그 페이지 요청을 날려서 HTTP 200 OK가 오는지를 확인해야겠죠. 엽토군 2019.11.23 11:25
- 네네 무슨 말인지 이해했습니다. 감사해용! 알 수 없는 사용자 2019.11.23 15:25
댓글 입력