C언어로 웹 페이지 소스에서 원하는 데이터만을 가져오는 프로그램을 짜고 싶은데 어떤 것을 공부해야할까요?

조회수 2188회

웹 페이지에서 원하는 데이터만 가져오는 프로그램을 짜고 싶은데 이런 기술을 뭐라고 하는지 알려주시면 스스로 공부해서 프로그램을 만들어보고 싶습니다.

  • 그런걸 크롤링이라고 합니다. 엽토군 2019.12.15 11:30
  • 파이썬 등으로 하는 것이 훨씬 간편할 겁니다. nowp 2019.12.16 11:47

1 답변

  • 좋아요

    2

    싫어요
    채택 취소하기

    두가지 작업이 필요합니다.

    첫번째는 http 를 이용하여 html 을 받아오는 작업 아래의 라이브러리를 활용할 수 있습니다.

    • curl
    • WinHttp (window 비스타 이상부터 추가된 기본 api)

    두번째는 받아온 html 을 파싱하여 원하는 데이터만 추출하는 작업. 아래의 라이브러리를 활용해 볼 수 있습니다.

    https://github.com/fffaraz/awesome-cpp#xml

    그러나 c 은 성능이 좋은 대신 java, Go, python, ruby 등의 언어에 비해 문자열 처리가 수월하지 않으므로 작업량이 많을 수 밖에 없습니다.

답변을 하려면 로그인이 필요합니다.

프로그래머스 커뮤니티는 개발자들을 위한 Q&A 서비스입니다. 로그인해야 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)