首页 > 其他好文 > 详细

spark伪分布式安装与测试

时间：2015-07-08 23:04:47 阅读：585 评论：0 收藏：0 [点我收藏+]

标签：

1、下载scala2.11.5版本，下载地址为：http://www.scala-lang.org/download/2.11.5.html

2、安装和配置scala：

第一步：上传scala安装包并解压

技术分享

技术分享

第二步配置SCALA_HOME环境变量到bash_profile

技术分享

第三步 source 使配置环境变量生效：

技术分享

第四步验证scala：

技术分享

3、下载spark 1.2.0，具体下载地址：http://spark.apache.org/downloads.html

4、安装和配置spark：

第一步解压spark：

技术分享

技术分享

第二步配置SPARK_HOME环境变量：

技术分享

第三步使用source生效：

技术分享

进入spark的conf目录：

第四步修改slaves文件，首先打开该文件：

技术分享

技术分享

slaves修改后：

技术分享

第五步配置spark-env.sh

首先把spark-env.sh.template拷贝到spark-env.sh：

技术分享

然后打开“spark-env.sh”文件：

技术分享

spark-env.sh文件修改后：

技术分享

5、启动spark伪分布式帮查看信息：

第一步先保证hadoop集群或者伪分布式启动成功，使用jps看下进程信息：

技术分享

如果没有启动，进入hadoop的sbin目录执行 ./start-all.sh

第二步启动spark：

进入spark的sbin目录下执行“start-all.sh”：

技术分享

此刻我们看到有新进程“Master” 和"Worker"

我们访问“http://master:8080/”，进如spark的web控制台页面：

技术分享

从页面上可以看到一个Worker节点的信息。

我们进入spark的bin目录，使用“spark-shell”控制台：

技术分享

技术分享

通过访问"http://master:4040"，进入spark-shell web控制台页面：

技术分享

6、测试spark伪分布式：

我们使用之前上传到hdfs中的/data/test/README.txt文件进行mapreduce

取得hdfs文件：

技术分享

对读取的文件进行一下操作：

技术分享

使用collect命令提交并执行job：

readmeFile.collect

技术分享

查看spark-shell web控制台：

技术分享

states：

技术分享

端口整理：

master端口是7077

master webui是8080

spark shell webui端口是4040

spark伪分布式安装与测试

标签：

原文地址：http://my.oschina.net/u/559635/blog/476339

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！