import pprint
import urllib
from urllib.request import urlopen
from bs4 import BeautifulSoup
r = urllib.request.urlopen("주소").read()
soup = BeautifulSoup(r,"html.parser")
letters = soup.find_all('div')
A_soup = letters[9].find_all('a')
prefix = '주소'
lobbying = {}
for element in letters[9]:
try:
element = element.find_all('a')
for elem in element:
lobbying[elem.get_text()] = prefix + elem['href']
except:
pass
#질문
#현재 a태그 내부의 값을 불러와서 제목과 게시물 주소, 본문요약을 긁어오고있습니다.
#현재 페이지가 아래와같이 하이퍼링크가 제목 이미지 본문요약까지 다 감싸고있는상태인데..
#제목과 하이퍼링크만 가져오기위해서는 어떻게 해야할지 알고싶습니다.
#감사합니다.
#<a href=' ' >
#<span class="title>제목</span>
#<span class="excerpt">본문요약</span>
#</a>
댓글 입력