문자열에서 특정 문자열 추출하기

조회수 79회

안녕하세요,

제가 게시글의 제목에서 날짜 데이터를 수하려고 하거든요,

Beautifulsoup 사용해서 게시글의 제목을 따왔을 때 출력값이 아래와 같습니다. "\r\n\t\t\t\t\t\t\t\t\t\t\t\r\n\t\t\t\t\t\t\t\t\t\t\t\r\n\t\t\t\t\t\t\t\t\t\t\t\r\n\t\t\t\t\t\t\t\t\t\t\t2021년 1월 1일(금) 관광객내도현황\r\n\t\t\t\t\t\t\t\t\t\t" 이러한 문자열 데이터에서 여기서 "xxxx년 xx월 xx일" 형식으로 자동 수집하게 하려고 하는데 어떤 방법을 사용하면 좋을까요?

split이라던가, slicing 방법은 제목 형식이 조금만 바뀌면 안될거 같아서, 혹시 "%d%d%d%d년 %d%d월 %d%d일" 이런 포멧만을 추출하는 방법이 있을까요?

  • 정규표현식을 사용하시면 될 것같아요. toyseed 2021.4.29 12:20
  • replace나 split을 이용해야 할 텐데요. 어느 사이트에서 어느 항목을 긁어오는 것인가요? 초보 2021.4.29 14:53

1 답변

답변을 하려면 로그인이 필요합니다.

Hashcode는 개발자들을 위한 무료 QnA 사이트입니다. 계정을 생성하셔야만 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)

ᕕ( ᐛ )ᕗ
로그인이 필요합니다

Hashcode는 개발자들을 위한 무료 QnA사이트 입니다. 계정을 생성하셔야만 글을 작성하실 수 있습니다.