首页 > 其他好文 > 详细

Hadoop学习篇 2 初识 Hadoop

时间：2015-02-11 00:21:39 阅读：191 评论：0 收藏：0 [点我收藏+]

标签：

在一个全配置的集群上，运行Hadoop意味着在网络分布的不同服务器上运行一组守护进程（daemons)，这些守护进程或运行在单个服务器上，或运行与多个服务器上，他们包括:

(1) NameNode（名字节点）

(2) DataNode（数据节点）

(3) Secondary NameNode （次名节点）

(4) JobTracker （作业跟踪节点）

(5) TaskTracker (任务跟踪节点）

NameNode

被认为是Hadoop守护进程中最重要的一个，可以说，NameNode就是一个大脑。

技术分享

运行NameNode会消耗掉大量的内存和I/O资源，因此，为了减轻机器的负载，驻留NameNode的服务器一般不会负责MapReduce的计算、存储用户数据。这也意味着，NameNode不会和JobTracker\TashTracker存在于同一台服务器上。一旦NameNode服务器出现宕机，造成的影响一般会比较严重。

DataNode

每个集群的从节点上都会驻留一个DataNode的守护进程，来执行分布式文件系统的繁重工作——将HDFS数据快读取或写入到本地文件系统的实际文件中。当希望对HDFS文件进行读写时，文件被分割为多个块，有NameNode告知客户端每个数据块驻留在那个DataNode。客户端直接与DataNode守护进程进行通信，来处理与数据块对相对应的本地文件。DataNode与DataNode节点直接也可以直接进行通信，用于完成数据的复制。

技术分享

上图解释了NameNode和DataNode节点的作用，NameNode指明了数据存放的名称和位置，分别为/user/chuck/data1 下的1、2、3文件和存储在 /user/james/data2下的

4、5文件。四个DataNode实现了1、2、3、4、5文件的复制。确保了任何一个DataNode节点失败后任然可以正常工作。DataNode会不断的向NameNode节点报告，将当前节点存储的数据块告知NameNode,为之提供本地修改的相关信息，同时接受指令的创建、移动或删除本地磁盘上的数据块。

Secondary NameNode

未完......

Hadoop学习篇 2 初识 Hadoop

标签：

原文地址：http://www.cnblogs.com/CBDoctor/p/4285158.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！