hadoop을 이용한 빅데이터 처리 방법을 배우고싶습니다. 좋은 교재 혹은 사이트 추천부탁드립니다


빅데이터쪽으로 공부를 하고자 하는데 전혀 무지 합니다. 단순히 프로그램적인 개념만 있고 clustrering , node 이런 개념에 대해서 무지합니다. hadoop을 이용해서 익히고자 하는데 좋은 교재 혹은 사이트 있으면 추천 부탁드립니다. 유 , 무료 상관없습니다.


조회수 215


1 답변


보통은 hadoop.apache.org 에 있는 문서나 튜토리얼을 잘 찾아 보는게 기본입니다. 궁금해 하시는 부분들은 Architecture 문서들을 잘 읽어보는게 중요합니다.

특히 아래의 3가지는 꼭 읽어보시기 바랍니다.

HDFS: http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html

MapReduce: http://hadoop.apache.org/docs/current/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapReduceTutorial.html

Yarn: http://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/YARN.html

hadoop 자체는 분산 파일 시스템 (hdfs) 와 분산 컴퓨팅 시스템 (Yarn) 으로 이루어져 있으며, 이를 기반으로 한 다양한 플랫폼이 존재합니다. 하둡 공식 페이지 뿐만 아니라, cloudera 나 hortonworks 같은 업체 홈 페이지를 잘 돌아다녀도 하둡과 연동되는 다양한 플랫폼에 대한 정보를 얻으실수 있습니다.

처음 공부하시는 분이라면 간단한 한글 책을 보면서 공부하시는 것도 좋은 방법입니다. 다만 디테일한 부분은 오픈소스 특성상 시간이 지나면 새로운 기술들이 적용되므로 HDFS, MapReduce, Yarn에 대한 이해를 높이면 새로운 기술이나, 플랫폼을 익히는데도 도움이 됩니다.

  • 2016년 07월 15일에 작성됨

로그인이 필요한 기능입니다.

Hashcode는 개발자들을 위한 무료 QnA사이트 입니다. 작성한 답변에 다른 개발자들이 댓글을 작성하거나 좋아요/싫어요를 할 수 있기 때문에 계정을 필요로 합니다.
► 로그인
► 계정만들기
Close