Hadoop의 기본 모듈과 생태계 

Hadoop은 4개의 기본 모듈로 구성된다. Hadoop Common, HDFS, MapReduce, YARN이 그것들이다.


Hadoop Common : 다른 모듈이 사용할 수 있는 라이브러리와 유틸리티 모음
HDFS : 데이터를 분산하고 안전하게 저장하는 파일 시스템
YARN : 리소스 관리 플랫폼으로 클러스터의 컴퓨팅 리소스를 관리하고 스케쥴링
MapReduce : 큰 데이터 집합에 대해 분산 컴퓨팅을 하는 모듈. (Map(), Reduce()로 나뉨)


HBase, Pig, Hive 등의 모듈들도 다 이 네개의 기본 모듈 위에서 동작하는 것들이다.






출처 : http://ddmix.blogspot.kr/2015/11/hadoop-1-stack-overview.html


+ Recent posts