편집 기록

편집 기록
  • 프로필 nowp님의 편집
    날짜2021.08.17

    파이썬으로 웹 크롤링하는걸 연습중인데 잘 모르는부분이 있습니다


    beautifulsoup을 사용해서 연습중이고 웹페이지에서 태그랑 클래스 잘 찾는법이 궁금하고 soup.find를 써서 내가 원하는걸 찾을때 태그랑 클래스로 밖에 못찾는지 궁금합니다.

    그리고 soup.find_all 해서 한 태그에서 정보가 여러개 나왔을때 4번째꺼를 내가 얻고자한다면 어떻게해야되나요? 제가 원하는게 4번째꺼에 있는데 그것만 특정하려고 해도 find를 제대로 쓸줄 몰라서요. 태그랑 클래스로 특정했는데 여러개가 나왔습니다.

    제가 작성중인 코드입니다

    import requests
    from bs4 import BeautifulSoup
    
    url ="https://search.naver.com/search.naver?where=nexearch&sm=top_hty&fbm=1&ie=utf8&query=%EC%86%8D%EC%B4%88%EB%82%A0%EC%94%A8"
    res = requests.get(url)
    res.raise_for_status()
    
    soup = BeautifulSoup(res.text, "lxml")
    temperture = soup.find_all("div", attrs={"class":"todaytemp"})
    
    dust = soup.find_all("span", attrs={"class","num"})
    print(dust)
    
  • 프로필 김홍재님의 편집
    날짜2021.08.15

    파이썬으로 웹 크롤링하는걸 연습중인데 잘 모르는부분이 있습니다


    beautifulsoup을 사용해서 연습중이고 웹페이지에서 태그랑 클래스 잘 찾는법이 궁금하고 soup.find를 써서 내가 원하는걸 찾을때 태그랑 클래스로 밖에 못찾는지 궁금합니다 그리고 soup.find_all 해서 한 태그에서 정보가 여러개 나왔을때 4번째꺼를 내가 얻고자한다면 어떻게해야되나요? 제가 원하는게 4번째꺼에 있는데 그것만 특정하려고 해도 find를 제대로 쓸줄 몰라서요.. 태그랑 클래스로 특정했는데 여러개가 나왔습니다.

    제가 작성중인 코드입니다 import requests from bs4 import BeautifulSoup

    url ="https://search.naver.com/search.naver?where=nexearch&sm=top_hty&fbm=1&ie=utf8&query=%EC%86%8D%EC%B4%88%EB%82%A0%EC%94%A8" res = requests.get(url) res.raise_for_status()

    soup = BeautifulSoup(res.text, "lxml") temperture = soup.find_all("div", attrs={"class":"todaytemp"})

    dust = soup.find_all("span", attrs={"class","num"}) print(dust)