码迷,mamicode.com
首页 > 其他好文 > 详细

spark on yarn

时间:2017-12-22 23:01:19      阅读:160      评论:0      收藏:0      [点我收藏+]

标签:pac   com   技术分享   image   配置文件   driver   错误解决   xml配置   变量   

公司中一般采用spark on yarn 模式,下面主要介绍spark on yarn的安装与简单程序运行。

1、spark on yarn两种运行模式

yarn-cluster:用于生产环境。Driver和AM运行在一起,client单独。

yarn-client:能立即看到输出结果。Driver运行在本地。AM仅用来管理资源。

client提交的job都会在worker上分配一个唯一的APPmaster。

2、配置spark-env.sh文件,让spark找到yarn在哪里

HADOOP_CONF_DIR=/home/hadoop/app/hadoop/etc/hadoop

3、配置slaves文件,指定在哪些节点运行worker

技术分享图片

4、spark-env.sh—spark的环境变量

技术分享图片

5、试运行集群

bin/spark-shell --master yarn-client

启动成功:

技术分享图片

6、作业提交(运行pi)

bin/spark-submit \
--class org.apache.spark.examples.JavaSparkPi \
--master yarn-client \
--num-executors 1 \
--driver-memory 1g \
--executor-memory 1g \
--executor-cores 1 \
lib/spark-examples-1.6.1-hadoop2.6.0.jar

技术分享图片

错误解决:

 技术分享图片

解决方式:

  • 同步时间
  • 在hadoop配置文件中yarn-site.xml配置

技术分享图片

 

spark on yarn

标签:pac   com   技术分享   image   配置文件   driver   错误解决   xml配置   变量   

原文地址:http://www.cnblogs.com/VillageKnight-Ding/p/8082893.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!