C언어로 웹 페이지 소스에서 원하는 데이터만을 가져오는 프로그램을 짜고 싶은데 어떤 것을 공부해야할까요?
조회수 2188회
1 답변
-
두가지 작업이 필요합니다.
첫번째는 http 를 이용하여 html 을 받아오는 작업 아래의 라이브러리를 활용할 수 있습니다.
- curl
- WinHttp (window 비스타 이상부터 추가된 기본 api)
두번째는 받아온 html 을 파싱하여 원하는 데이터만 추출하는 작업. 아래의 라이브러리를 활용해 볼 수 있습니다.
그러나 c 은 성능이 좋은 대신 java, Go, python, ruby 등의 언어에 비해 문자열 처리가 수월하지 않으므로 작업량이 많을 수 밖에 없습니다.
댓글 입력