루비 온레일즈에서 웹크롤링할 때 특정 태그 안의 내용을 가져오는 것이 궁금합니다.


오픈소스라이브러리 nokogiri를 이용해서 웹크롤링을 하는 예제를 해보고 있습니다. 특정 태그 안의 내용을 가져오는 것을 어떻게 하는지 궁금합니다. 예를 들어

<div class="story_area">
    <div class="title_area">
        <h4 class="h_story"><strong class="blind">줄거리</strong></h4>
    </div>

    <h5 class="h_tx_story">영화가 세상의 전부인 소년 토토와 낡은 마을 극장의 영사기사 알프레도의 애틋한 우정!<br>25년간 전세계를 웃고 울린 감동대작의 부활!</h5>

    <p class="con_tx">유명 영화감독으로 활약 중인 토토(자크 페렝)는 고향 마을의 영사기사 알프레도(필립 느와레)의 사망소식에 30년 만에 고향을 찾는다. 어린 시절 영화가 세상의 전부였던 소년 토토(살바토레 카스치오)는 학교 수업을 마치면 마을 광장에 있는 낡은 ‘시네마천국’이라는 극장으로 달려가 영사 기사 알프레도와 친구로 지내며 어깨너머로 영사기술을 배운다. 어느 날 관객들을 위해 광장에서 야외 상영을 해주던 알프레도가 그만 화재 사고로 실명하게 되고, 토토가 그의 뒤를 이어 ‘시네마천국’의 영상기사로 일하게 된다. 실명한 후에도 토토의 친구이자 아버지로 든든한 정신적 지주가 되어준 알프레도는 청년이 된 토토(마코 레오나디)가 사랑하는 여자 엘레나(아그네즈 나노)의 부모님의 반대로 좌절하자 넓은 세상으로 나가서 더 많은 것을 배우라며 권유하고 토토는 고향을 떠나게 되는데...</p>


    <a href="http://terms.naver.com/ncrEntry.nhn?dicId=moviework_dic&ncrDocId=ef6_290" target="_blank" class="movie_terms"><em class="blind">영화백과 보기</em></a>

</div>

위와같은 코드가 존재할때 영화의 줄거리인 p태그안에 있는 내용을 가져 오고 싶은 데 어떻게 해야될지 궁금합니다.

  • 2016년 06월 01일에 수정됨
    그렙에서 웹 프론트 개발을 하고 있습니다.
  • 2016년 05월 19일에 작성됨

조회수 196


1 답변


좋아요
2
싫어요
채택취소하기

한개만 가져올때는 at_css 를 활용해 보세요.

doc = Nokogiri::HTML(open('해당주소', 'User-Agent' => USER_AGENT))
doc.at_css('p.con_tx').text
  • 2016년 05월 19일에 작성됨
    그렙에서 웹 프론트 개발을 하고 있습니다.

로그인이 필요한 기능입니다.

Hashcode는 개발자들을 위한 무료 QnA사이트 입니다. 작성한 답변에 다른 개발자들이 댓글을 작성하거나 좋아요/싫어요를 할 수 있기 때문에 계정을 필요로 합니다.
► 로그인
► 계정만들기
Close