편집 기록

프로필 엽토군님의 편집

날짜2019.08.04
파이썬 크롤링에 관하여 질문드립니다.

python

crawling

div

html

api
목표

현재 약 1000개이상의 api 를 리스트에 넣는다

for문을 이용하여 api 주소에서 프레임소스를 받는다

프레임소스에서 div class : "xxx"를 출력한다

목표1번을 할려고하니 http주소api라 그런가 바로 list에 넣을려니 자꾸 에러가 뜨더라고여
그래서 그 친구들을 str로 변환시켜줘야하는데 하나하나 하기에는 너무 번거롭고 방법이 떠오르지 않습니다.
목표2번은 구현은 아직 못해보고있습니다. 머리로는 이렇게하면 되겠지 하는데 역시 뜻대로 되지 않네요
목표3번 소스코드는 아래 부분입니다.

import requests from bs4 import BeautifulSoup def get_subjects(): subjects = [] req = requesets.get('view-source:http://www.saramin.co.kr/zf_user/jobs/relay/view-detail?rec_idx=36688317&rec_seq=0') html = req.text soup = BeautifulSoup(html, 'html.parser') divs = soup.findall('div', {"class" : "user_content"}) for div in divs: links = div.findall() return subjects

여러 동영상과 글을 읽으면서 조금 채워나갔습니다. 각각의 다른 동영상들과 다른 프로그램을 사용하길레 주피터 노트북을 이용하여 만들었습니다.
이 코드는 프레임소스에서 div class를 뽑아낼려고 짜둔건데 아직 미완성입니다.

likns = div.findall() for link in links:

이 구문에서 자꾸 문법에 맞지않는다는 오류가 나와서 이해가안되고 있습니다.

class needs: def __inif__(self, requirement, preference): self.requirement = requirement self.preference = preference def __str__(self): return self.requirement + self.preference

그래서 이 클래스에 넣어서 html에 있는 내용을 파싱하고싶습니다
프로필 알 수 없는 사용자님의 편집

날짜2019.08.04
파이썬 크롤링에 관하여 질문드립니다.

python

crawling

div

html

api
목표 현재 약 1000개이상의 api 를 리스트에 넣는다 for문을 이용하여 api 주소에서 프레임소스를 받는다 프레임소스에서 div class : "xxx"를 출력한다
목표1번을 할려고하니 http주소api라 그런가 바로 list에 넣을려니 자꾸 에러가 뜨더라고여 그래서 그 친구들을 str로 변환시켜줘야하는데 하나하나 하기에는 너무 번거롭고 방법이 떠오르지 않습니다. 목표2번은 구현은 아직 못해보고있습니다. 머리로는 이렇게하면 되겠지 하는데 역시 뜻대로 되지 않네요 목표3번 소스코드는 아래 부분입니다.

import requests from bs4 import BeautifulSoup def get_subjects(): subjects = [] req = requesets.get('view-source:http://www.saramin.co.kr/zf_user/jobs/relay/view-detail?rec_idx=36688317&rec_seq=0') html = req.text soup = BeautifulSoup(html, 'html.parser') divs = soup.findall('div', {"class" : "user_content"}) for div in divs: links = div.findall() return subjects

여러 동영상과 글을 읽으면서 조금 채워나갔습니다. 각각의 다른 동영상들과 다른 프로그램을 사용하길레 주피터 노트북을 이용하여 만들었습니다. 이 코드는 프레임소스에서 div class를 뽑아낼려고 짜둔건데 아직 미완성입니다.

likns = div.findall() for link in links:

이 구문에서 자꾸 문법에 맞지않는다는 오류가 나와서 이해가안되고 있습니다.

class needs: def __inif__(self, requirement, preference): self.requirement = requirement self.preference = preference def __str__(self): return self.requirement + self.preference

그래서 이 클래스에 넣어서 html에 있는 내용을 파싱하고싶습니다

편집 기록

편집 기록

프로필 엽토군님의 편집

날짜2019.08.04

파이썬 크롤링에 관하여 질문드립니다.

python

crawling

div

html

api

프로필 알 수 없는 사용자님의 편집

날짜2019.08.04

파이썬 크롤링에 관하여 질문드립니다.

python

crawling

div

html

api