标签:
.com/5a2376deb02c49ce812ca95351af038c/e4aa789cb34d4b439543af3711baea1a.jpg)
.com/c96547d936744e94befd049919a4c796/11a86a3b02684031adf8df9dbf9de505.jpg)
.com/d8cc00599ce549f0886835c1b79bc66e/2f24ac9c4b5a4b8190b0206dc3229abe.jpg)
<property>
<name>fs.defaultFS</name>
<value>hdfs://cluster1</value>
</property>
【这里的值指的是默认的HDFS路径。当有多个HDFS集群同时工作时,用户如果不写集群名称,那么默认使用哪个哪?在这里指定!该值来自于hdfs-site.xml中的配置】
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/tmp</value>
</property>
【这里的路径默认是NameNode、DataNode、JournalNode等存放数据的公共目录。用户也可以自己单独指定这三类节点的目录。】
<property>
<name>ha.zookeeper.quorum</name>
<value>hadoop2:2181,hadoop3:2181,hadoop4:2181</value>
</property>
【这里是ZooKeeper集群的地址和端口。注意,数量一定是奇数,且不少于三个节点】
</configuration>
<configuration>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
【指定DataNode存储block的副本数量。默认值是3个,我们现在有4个DataNode,该值不大于4即可。】
<property>
<name>dfs.nameservices</name>
<value>cluster1</value>
</property>
【使用federation时,使用了1个HDFS集群。这里抽象出两个NameService实际上就是给这1个HDFS集群起了个别名。名字可以随便起,相互不重复即可】
<property>
<name>dfs.ha.namenodes.cluster1</name>
<value>hadoop101,hadoop102</value>
</property>
【指定NameService是cluster1时的namenode有哪些,这里的值也是逻辑名称,名字随便起,相互不重复即可】
<property>
<name>dfs.namenode.rpc-address.cluster1.hadoop101</name>
<value>hadoop0:9000</value>
</property>
【指定hadoop101的RPC地址】
<property>
<name>dfs.namenode.http-address.cluster1.hadoop101</name>
<value>hadoop0:50070</value>
</property>
【指定hadoop101的http地址】
<property>
<name>dfs.namenode.rpc-address.cluster1.hadoop102</name>
<value>hadoop1:9000</value>
</property>
【指定hadoop102的RPC地址】
<property>
<name>dfs.namenode.http-address.cluster1.hadoop102</name>
<value>hadoop1:50070</value>
</property>
【指定hadoop102的http地址】
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://hadoop0:8485;hadoop1:8485;hadoop2:8485/cluster1</value>
</property>
【指定cluster1的两个NameNode共享edits文件目录时,使用的JournalNode集群信息】
<property>
<name>dfs.ha.automatic-failover.enabled.cluster1</name>
<value>true</value>
</property>
【指定cluster1是否启动自动故障恢复,即当NameNode出故障时,是否自动切换到另一台NameNode】
<property>
<name>dfs.client.failover.proxy.provider.cluster1</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
【指定cluster1出故障时,哪个实现类负责执行故障切换】
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/usr/local/hadoop/tmp/journal</value>
</property>
【指定JournalNode集群在对NameNode的目录进行共享时,自己存储数据的磁盘路径】
<property>
<name>dfs.ha.fencing.methods</name>
<value>sshfence</value>
</property>
【一旦需要NameNode切换,使用ssh方式进行操作】
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_rsa</value>
</property>
【如果使用ssh进行故障切换,使用ssh通信时用的密钥存储的位置】
</configuration>
<configuration>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop0</value>
</property>
【自定ResourceManager的地址,还是单点,这是隐患】
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
【指定运行mapreduce的环境是yarn,与hadoop1截然不同的地方】
</configuration>
.com/6c089e5d254947ee95751c6ac66741f7/1ad5e03dc78d4e50b0095652f53aadda.jpg)
.com/a1ebc8becbb447c69a1eb6b66c64aabd/clipboard.png)
.com/1698be03eacc45bf85b82fe2545bc51b/ef7eacb279384437bff45e16456b07fe.jpg)
.com/4174b7463c044c258bbed3b8e5c3a830/3083f2b3511347c5b00d094b9f127e6c.jpg)
.com/aff0cff72d61493c8f77bbaea223843c/56d043c538e84e49a57983f3a73e11b5.jpg)
.com/affadeb5d8e84d3c9b65c2b951825629/38e411bf3ece4011b62bb9d3f1d6f595.jpg)
.com/236a0c07028e46b282a9a39761f0fc9c/clipboard.png)
.com/146c256b0c8f4f30803137865491984f/82ab2d93708e412695c24dbc5d3a9a9f.jpg)
.com/06b4e69456c44d5091819a24c686ecec/e1eb8414dca548cb91b361b1aafd18ea.jpg)
.com/78bc78c447124c3b9e7582cdd8e22552/aaab4d88218e4017be31d24267791bd0.jpg)
.com/69f8165ae5694b59b6364dfab9b346e6/33aabf555ae24c0e97affb04e17e419c.jpg)
标签:
原文地址:http://www.cnblogs.com/thinkpad/p/4690749.html