标签:
Hadoop的组成
Hadoop的两部分分别是:
分布式存储HDFS
分布式计算MapReduce
HDFS是一个master/slave的结构,就一般的部署来说,
在master上只运行一个NameNode,而在每一个slave上运行一个DataNode。
MapReduce是一个变成模型,用以进行大量数据计算。
MapReduce源于这个模型中两项核心操作:
Map:把一组数据一对一地映射为另外一组数据
Reduce:对一组数据模型进行归约
映射和归约的规则都由一个函数指定。
标签:
原文地址:http://www.cnblogs.com/tuhooo/p/5480769.html