Beautifulsoup을 이용한 크롤링 질문 드립니다.

조회수 1079회

파이썬을 이용해서 크롤링중입니다. 제가 긁어오려는 사이트에서 제가 가져오고 싶은 부분은 논문 초록에 해당하는 Abstract 라는 부분입니다. 이 Abstract라는 부분의 형식이 논문에 따라 2가지 인데 두 가지 모두 가져오고싶습니다.

캡쳐에서 1번, 2번에 해당하는 형식 두가지 입니다. 이를 가져오기 위해

abstract_of_paper = soup.select('div.abstract') 라고 코딩하니 2번 중에서 저에게 필요 없는 a번도 크롤링 되는 상황입니다.

캡처에서 1번 혹은 2번에 해당할경우 긁어오되, a를 제외하고 긁어올 수 있는 방법을 알고싶습니다.

soup.select에서 or 구문이나 | 를 쓰면 해결 할 수 있을것같은데 잘 모르겠습니다. 도움부탁드립니다.

이미지

  • (•́ ✖ •̀)
    알 수 없는 사용자

답변을 하려면 로그인이 필요합니다.

프로그래머스 커뮤니티는 개발자들을 위한 Q&A 서비스입니다. 로그인해야 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)