Spark HA on yarn 最简易安装。

时间：2017-06-19 20:15:08 阅读：200 评论：0 收藏：0 [点我收藏+]

标签：url org 安装 status linux服务 jdk1.8 blog 添加 size

机器部署：

准备两台机以上linux服务器，安装好JDK，zookeeper，hadoop

spark部署

master：hadoop1，hadoop2(备用)

worker：hadoop2，hadoop3，hadoop4

软件准备

spark下载网址：http://spark.apache.org/downloads.html

当前最新版本为2.11，下载你所需要的spark版本，注意spark版本与hadoop版本要相互匹配。

技术分享

安装步骤：

1.上传spark安装包到linux

技术分享

2. 解压安装包到指定位置（比如说我的在apps下）

tar -zxvf spark-1.6.3-bin-hadoop2.6.tgz -C apps/

3.配置spark

进入spark安装目录conf下

cd apps/spark-1.6.3-bin-hadoop2.6/conf/spark-env.sh

重命名spark-env.sh.template
mv spark-env.sh.template spark-env.sh

修改spark-env.sh

在该配置文件中添加配置

export JAVA_HOME=/home/kinozk/apps/jdk1.8.0_9

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=zk1,zk2,zk3 -Dspark.deploy.zookeeper.dir=/spark"

export HADOOP_CONF_DIR=/home/kinozk/apps/hadoop/etc/hadoop

重命名并修改slaves.template

mv slaves.template slaves

vi slaves

在该文件中红添加字节嗲你所在位置（woker节点）

hadoop2

hadoop3

hadoop4

保存退出

技术分享

将配置好的Spark拷贝到其他节点上

scp -r spark-1.6.3-bin-hadoop2.6/ hadoop2:$PWD

scp -r spark-1.6.3-bin-hadoop2.6/ hadoop3:$PWD

scp -r spark-1.6.3-bin-hadoop2.6/ hadoop4:$PWD

配置环境变量

这里就不说了，跟配置hadoop，zookeeper时的配置方式下相同，

启动集群

先启动zookeeper，然后启动hadoop，最后启动spark

需要注意的是，spark与hadoop中都有start-all.sh命令，因此启动spark时进入spark安装目录的跟目录下

在hadoop1上执行sbin/start-all.sh脚本，然后在hadoop2上执行sbin/start-master.sh启动第二个Master

登录spark管理界面查看集群状态（主节点）：http://hadoop1:8080/

技术分享

此时hadoop1节点status为alive，hadoop2节点status为standby

在hadoop1 上kill掉master进程，再登录spark管理界面查看集群状态（主节点）：http://hadoop2:8080/查看hadoop2状态，是否被切换为alive状态

Spark HA on yarn 最简易安装。

标签：url org 安装 status linux服务 jdk1.8 blog 添加 size

原文地址：http://www.cnblogs.com/kinoliu/p/7050354.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行