Html문에서 <h3> 태그안의 문자 가져오기 중 질문드립니다.
조회수 635회
Html 문에서 h3 태그 안의 회사 이름을 가져오기 위하여 다음과 같은 코드를 작성하였습니다. 결과 값으로는 자꾸 [ ] 빈 어레이에 해당하는 jobs 값만 나옵니다.
단순하게 find, find_all 을 div, a, span, 에 맞추어서 사용하면 될 것 같은데 도저히 방법을 모르겠네요. 제가 모르는 공식 같은게 있는 건가요??? 일단, 제 VSCode 에서 company = html.find("h3",{"itemprop":"name"}) << find 메서드 자체가 활성화 되지 않습니다. (활성화되면 컬러로 나오는데, 그냥 흰 색으로 나옴) 뭔가 조건이 안 맞아서 그런거 같은데 무슨 조건이 필요한건지 모르겠네요.
아시는 분은 답글 부탁 드립니다. 참 답답하네요.
import requests
import csv
from bs4 import BeautifulSoup
ro_url = "https://remoteok.com/"
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36',}
ro = requests.post(ro_url, headers=headers)
ro_status = ro.status_code
soup = BeautifulSoup(ro.text, 'html.parser')
def extract_ro() :
jobs = []
soup = BeautifulSoup(ro.text, 'html.parser')
results = soup.find_all("td",{"class":"company"})
for result in results :
job = extract_ro_jobs(result)
jobs.append(job)
return jobs
def extract_ro_jobs(html) :
try :
company = html.find("h3",{"itemprop":"name"})
except :
None
return {"Company" : company}
extract_ro()
댓글 입력