这里介绍一下hadoop的组成, hadoop主要由两部分组成,,一个是hdfs,另一个是mapreduce
这两个部分在hadoop 2.2.0中分别用start-dfs.sh和start-yarn.sh启动。mapreduce 在2.0版本中有了一个新名字yarn.
dfs 主要用来启动 namenode 和 datanode, namenode既是是传说中的matser, datanode 是传说中的slave。
yarn 主要用来启动resourcemanager 和nodemanager。resourcemanager也被称为jobtracker,nodemanger也被称为tasktracker.
下图是yarn的组成结构图。详细介绍请看
http://hadoop.apache.org/docs/r2.3.0/hadoop-yarn/hadoop-yarn-site/YARN.html
reference:http://hadoop.apache.org/docs/r2.3.0/hadoop-yarn/hadoop-yarn-site/YARN.html
原文地址:http://blog.csdn.net/robinsonmhj/article/details/25013059