标签:hadoop mapreduce 框架 yarn introduce
用下图描述 hadoop 的四元素
hadoop 上最常用的文件系统。
HDFS 用的是 master/slave architecture,包括一个master (NameNode) 管理文件系统的大量数据,和数个slaves(DataNodes)用于真正的存储数据.
HDFS里的一个文件被分成若干个块(Blocks)分别存储在若干个DataNodes里。
NameNode
DataNode
HDFS 提供了shell 和一系列的指令用于文件系统的交互。
以一种可靠地、高容错性的方式在集群上并行化的处理大规模数据。
MapReduce Framework 的每个 Cluster-node 上包含一个 JobTracker(master) 和一个 TaskTracker(slave):
版权声明:本文为博主原创文章,未经博主允许不得转载。
标签:hadoop mapreduce 框架 yarn introduce
原文地址:http://blog.csdn.net/light_lj/article/details/47950115