码迷,mamicode.com
首页 > 其他好文 > 详细

HDFS

时间:2018-07-13 00:03:08      阅读:147      评论:0      收藏:0      [点我收藏+]

标签:读写   完成后   hdfs   返回   访问   个数   基本   合数   重写   

 

 

1、基本概念
-块(block)
-namenode
-datanode

hdfs文件分成块存储,默认64M,块是文件存储的逻辑单元
hdfs有两类节点:nomenode、datanode

nomenode是管理节点,存放文件元数据
(1)文件与数据块的映射表
(2)数据块与数据节点的映射表
datanode是hdfs的工作节点,存放数据块。

技术分享图片

2、数据管理策略
每个数据块3个副本,分布在两个机架内的三个节点
心跳检测:datanode定期向namenode发送心跳消息(检测是否节点挂了)
二级namenode:二级namenode定期同步元数据映像文件和修改日志,namenode发送故障时,替换之

3、hdfs中文件的读写操作
客户端发起请求,namenode查询元数据,返回所在的节点,客户端再去读取所在节点的块进行组装

技术分享图片

 

 文件先拆分成块,通知namenode,找到足够磁盘空间的datanode,客户端把块再写入到namenode,再复制到其他节点,完成后告知namenode更新元数据

技术分享图片

3、hdfs特点
(1)数据冗余,硬件容错
(2)流式的数据访问:(数据一次写入多次读取,无法修改。只能删掉重写)
(3)存储大文件(小文件namenode压力一样大)

适合数据批量读写,吞吐量高
不适合交互式应用,低延时很难满足
适合一次写入多次读取,顺序读写
不支持多用户并发写相同文件

4、hdfs使用
hdfs命令:
hadoop fs -ls /
hadoop fs -rm /xxx
hadoop dfsadmin -report 打印信息

HDFS

标签:读写   完成后   hdfs   返回   访问   个数   基本   合数   重写   

原文地址:https://www.cnblogs.com/zzl-156783663/p/9302272.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!