首页 > 其他好文 > 详细

HDFS体系结构详解

时间：2015-05-25 16:03:54 阅读：103 评论：0 收藏：0 [点我收藏+]

标签：

HDFS的体系框架是Master/Slave结构，一个典型的HDFS通常由单个NameNode和多个DataNode组成。NameNode是一个中心服务器，负责文件系统的名字空间的操作，比如打开、关闭、重命名文件或目录，它负责维护文件路径到数据块的映射，数据块到DataNode的映射，以及监控DataNode的心跳和维护数据块副本的个数。集群中的DataNode一般是一个节点一个，负责管理它所在节点上的存储。HDFS暴露了文件系统的名字空间，用户能够以文件的形式在上面存储数据。从内部看，一个文件其实被分成一个或多个数据块，这些块存储在一组DataNode上。DataNode负责处理文件系统客户端的读写请求。在NameNode的统一调度下进行数据块的创建、删除和复制。
所有对目录树的更新和文件名和数据块关系的修改，都必须能够持久化，文件在HDFS中存储图如图2：
<ignore_js_op> 技术分享

图2  文件在HDFS中的存储图
HDFS涉及到NameNode、DataNode和客户端们之间的交互。本质上，客户端与NameNode通讯是通过获取或者修改文件的元数据，与 DataNode进行实际的I/O操作。如图3所示，在HDFS中有三个重要的角色：NameNode、DataNode和Client，其中Client就是需要获取分布式文件系统文件的应用程序。
这里通过三个操作来说明他们之间的交互关系
(l)文件写入。首先Client向NameNode发起文件写入的请求，NameNode根据文件大小和文件块配置情况，返回给Client它所管理部分DataNode的信息。Client将文件划分为多个Block，根据DataNode的地址信息，按顺序写入到每一个DataNode块中。
(2)文件读取。Client向NameNode发起文件读取的请求，NameNode返回文件存储的DataNode的信息。Client根据返回的信息读取DataNode上的文件信息。
(3)文件Block复制。NameNode发现部分文件的Block不符合最小复制数或者部分DataNode失效，通知DataNode相互复制Block。DataNode收到通知后开始直接相互复制。
<ignore_js_op> 技术分享

图3  HDFS结构图

HDFS体系结构详解

标签：

原文地址：http://www.cnblogs.com/CRXY/p/4527866.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！