Beautifulsoup을 이용한 크롤링 질문 드립니다.
조회수 1079회
파이썬을 이용해서 크롤링중입니다. 제가 긁어오려는 사이트에서 제가 가져오고 싶은 부분은 논문 초록에 해당하는 Abstract 라는 부분입니다. 이 Abstract라는 부분의 형식이 논문에 따라 2가지 인데 두 가지 모두 가져오고싶습니다.
캡쳐에서 1번, 2번에 해당하는 형식 두가지 입니다. 이를 가져오기 위해
abstract_of_paper = soup.select('div.abstract') 라고 코딩하니 2번 중에서 저에게 필요 없는 a번도 크롤링 되는 상황입니다.
캡처에서 1번 혹은 2번에 해당할경우 긁어오되, a를 제외하고 긁어올 수 있는 방법을 알고싶습니다.
soup.select에서 or 구문이나 | 를 쓰면 해결 할 수 있을것같은데 잘 모르겠습니다. 도움부탁드립니다.
-
(•́ ✖ •̀)
알 수 없는 사용자
댓글 입력