大数据学习第六天

时间：2019-06-11 20:56:09 阅读：174 评论：0 收藏：0 [点我收藏+]

标签：hdf datanode slaves 存储解压 mapr sla jdk 集群

HDFS安装-完全分布式

1、先决条件

a) 三台机器（以上）

b) 每台机器时间一致，相差30秒以内。

c) 必须有主机名和ip映射。

d) 必须有JDK1.7,并且JDK的环境变量必须配置好。

i. rpm -ivh jdk-7u79-linux-x64.rpm 安装jdk

ii. 配置环境变量：vi ~/.bash_profile

在文件的最后添加：

export JAVA_HOME=/usr/java/default

export PATH=$PATH:$JAVA_HOME/bin

source ~/.bash_profile

e) 防火墙暂时关闭。

i. service iptables stop

ii. chkconfig iptables off

2、上传tar，并且解压。并且配置hadoop的环境变量

a) tar -zxvf hadoop-2.5.2.tar.gz

export HADOOP_HOME=/root/hadoop-2.5.1

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

3、编辑hadoop配置文件：hadoop-env.sh， core-site.xml， hdfs-site.xml，

Sleves。所有的配置文件在/root/hadoop-2.5.2/etc/hadoop目录中

Hadoop-env.sh

更改第25行

export JAVA_HOME=/usr/java/default

core-site.xml配置

<name>fs.defaultFS</name>

<value>hdfs://node5:9000</value> 表示namenode的主机名

</property>

<name>hadoop.tmp.dir</name>

<value>/hadoop</value>

</property>

Hdfs-site.xml 配置

<name>dfs.namenode.secondary.http-address</name> 配置SN的主机名

</property>

<name>dfs.namenode.secondary.https-address</name>

</property>

Slaves 配置

所有datanode的主机名

node1

node2

node3

4、设置sshd免密码登陆。

a) 找一台主节点：启动服务。

i. 执行命令生成密钥。ssh-keygen

ii. 拷贝主节点的公钥到所有节点中去。

\1. ssh-copy-id -i id_rsa.pub root@node2

5、拷贝文件：hosts，bash_profile hadoop目录

a) scp /etc/hosts root@hadoop2:/etc/

b) scp ~/.bash_profile root@hadoop2:~

c) scp -r /root/hadoop-2.5.2 root@hadoop2:~

6、格式化HDFS: hdfs namenode –format 必须在主节点上

7、在主节点上启动 start-dfs.sh

–分布式存储系统HDFS （Hadoop Distributed File System ）POSIX

• 分布式存储系统

• 提供了高可靠性、高扩展性和高吞吐率的数据存储服务

–分布式计算框架MapReduce

• 分布式计算框架（计算向数据移动）

•具有易于编程、高容错性和高扩展性等优点。

–分布式资源管理框架YARN（Yet Another Resource Management）

•负责集群资源的管理和调度

大数据学习第六天

标签：hdf datanode slaves 存储解压 mapr sla jdk 集群

原文地址：https://www.cnblogs.com/lkoooox/p/11005894.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行