편집 기록

편집 기록
  • 프로필 엽토군님의 편집
    날짜2020.08.30

    파이썬 BeautifulSoup을 사용하여, 웹스크래핑 시 데이터 추출 질문입니다.


    SH_result = requests.get("https://www.i-sh.co.kr/main/lay2/program/S1T262C273/www/brd/m_458/viewBrdDataList.do")
    SH_soup = BeautifulSoup(SH_result.text, "html.parser")
    page = SH_soup.find_all("p","ellipsis")
    print(page)
    
    <p class="ellipsis icon">
    <span class="icoNew">NEW</span>
    
    
                                    2020년 1차 역세권 청년주택 공공임대 2020년 1...
    
    
                                </p>, <p class="ellipsis icon">
    <span class="icoNew">NEW</span>
    
    
    
                                    분양신청
    
                                </p>, <p class="ellipsis icon">
    <span class="icoNew">NEW</span>
    
    
    
                                    현재 국민임대주택에 거주 중 입니다.
    
                                </p>, <p class="ellipsis icon">
    <span class="icoNew">NEW</span>
    
    
    
                                    특별공급 중 기관추천(장기복무군인) 물량 배제 관련
    
                                </p>, <p class="ellipsis icon">
    <span class="icoNew">NEW</span>
    
    
    
                                    행복주택 예비신혼부부 계약과 세대주 지정 문의드립니다.
    
                                </p>, <p class="ellipsis icon">
    <span class="icoNew">NEW</span>
    
    
    
                                    방화 11단지 온도 조절기 교체공사로 인한 세탁기 누수
    
                                </p>, <p class="ellipsis ">
    
    
    
                                    재계약심사  안내 서류를 늦게받았습니다
    
                                </p>, <p class="ellipsis ">
    
    
    
                                    생애최초 근로자 문의
    
                                </p>, <p class="ellipsis ">
    
    
                                    임대주택을 알아보려는데요. 무직이고 건설현장 일용직으로...
    
    
                                </p>
    

    현재 이 상태에서 저 한글(제목)만 추출해서 따로 저장하려고 합니다. 페이지를 넘겨가면서 실행해야 해서 계속 누적저장을 하고 싶은데 어떻게 해야할까요?

  • 프로필 알 수 없는 사용자님의 편집
    날짜2020.08.30

    파이썬 BeautifulSoup을 사용하여, 웹스크래핑 시 데이터 추출 질문입니다.


    SH_result = requests.get("https://www.i-sh.co.kr/main/lay2/program/S1T262C273/www/brd/m_458/viewBrdDataList.do") SH_soup = BeautifulSoup(SH_result.text, "html.parser") page = SH_soup.find_all("p","ellipsis") print(page) [ NEW

                                2020년 1차 역세권 청년주택 공공임대 2020년 1...
    
    
                            </p>, <p class="ellipsis icon">
    

    NEW

                                분양신청
    
                            </p>, <p class="ellipsis icon">
    

    NEW

                                현재 국민임대주택에 거주 중 입니다.
    
                            </p>, <p class="ellipsis icon">
    

    NEW

                                특별공급 중 기관추천(장기복무군인) 물량 배제 관련
    
                            </p>, <p class="ellipsis icon">
    

    NEW

                                행복주택 예비신혼부부 계약과 세대주 지정 문의드립니다.
    
                            </p>, <p class="ellipsis icon">
    

    NEW

                                방화 11단지 온도 조절기 교체공사로 인한 세탁기 누수
    
                            </p>, <p class="ellipsis ">
    
    
    
                                재계약심사  안내 서류를 늦게받았습니다
    
                            </p>, <p class="ellipsis ">
    
    
    
                                생애최초 근로자 문의
    
                            </p>, <p class="ellipsis ">
    
    
                                임대주택을 알아보려는데요. 무직이고 건설현장 일용직으로...
    
    
                            </p>]
    

    현재 이 상태에서 저 한글(제목)만 추출해서 따로 저장하려고 합니다. 페이지를 넘겨가면서 실행해야 해서 계속 누적저장을 하고 싶은데 어떻게 해야할까요?