标签:其他 超过 信息 etc ref 刷新 安全 inf 数据包
一:DataNode工作机制
(1)一个数据块在DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度、
快数据的校验和(验证数据完整性)以及时间戳
(2)DataNode启动后向NameNode注册,通过后,周期性(1小时)的向NameNode上报所有的块信息
(3)心跳是每3秒一次,心跳返回结果带有NameNode给DataNode的命令如复制块数据到另一台节点。
如果超过10分钟没有收到某个节点的心跳,则认为该节点已经不可用。
(4)集群运行中可以安全加入和退出节点。
二:校验数据完整性
三:掉线时限参数设置
四:服役新数据节点(增加新数据节点)
(1)从其他数据节点再克隆一台数据节点
(2)修改ip地址和主机名
(3)删除原来HDFS文件系统留存下来的文件(data和logs)
(4)source一下配置文件
五:退役旧数据节点
白名单:添加到白名单的主机节点都可以访问NameNode,不在白名单上的主机节点不可用,在HDFS上也不会显示
黑名单:在黑名单上的数据节点不可用,但在HDFS上有显示记录
1:白名单设置步骤:
(1)在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts文件
(2)将允许访问NameNode的主机名称写在上面
(3)在NameNode的hdfs-site.xml配置文件增加dfs.hosts属性
(4)将配置文件分发到所有节点
(5)刷新NameNode
命令:hdfs dfsadmin -refreshNodes
(6)更新ResourceManager节点
命令:yarn rmadmin -refreshNodes
2:黑名单设置
(1)在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts.exclude文件
(2)添加要退役的节点的主机名称
(3)在NameNode的hdfs.site.xml配置文件中增加dfs.hosts.exclude属性
(4)刷新NameNode和ResourceManager
标签:其他 超过 信息 etc ref 刷新 安全 inf 数据包
原文地址:https://www.cnblogs.com/lihui001/p/12500130.html