码迷,mamicode.com
首页 > 其他好文 > 详细

第一个spark程序

时间:2018-07-17 12:40:21      阅读:135      评论:0      收藏:0      [点我收藏+]

标签:you   href   new   pre   分享图片   文件结构   cat   图片   ica   

Scala开发,sbt打包,spark运行

1、创建文件目录结构:

技术分享图片

2、创建Scala程序 SimpleAPP.Scala:

技术分享图片

import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf               

object SimpleApp {
    def main(args: Array[String]) {
        val logFile = "file:///mnt/hgfs/share/resource/jitanjiali.docx"
       //Should be some file on your system
        val conf = new SparkConf().setAppName("Simple Application")
        val sc = new SparkContext(conf)
        val logData = sc.textFile(logFile, 2).cache()
        val numAs = logData.filter(line => line.contains(‘a‘)).count()
        val numBs = logData.filter(line => line.contains(‘b‘)).count()
        println("Lines with a : %s, Lines with b: %s".format(numAs, numBs)) 
    }
}

3、使用sbt打包Scala程序

该程序依赖 Spark API,因此需要通过 sbt 进行编译打包。 在./sparkapp 中新建文件 simple.sbt,添加如下内容,声明该独立应用程序的信息以及与 Spark 的依赖关系:

技术分享图片

技术分享图片

 文件 simple.sbt 指明 Spark 和 Scala 的版本。在上面的配置信息中,scalaVersion用来指定scala的版本,sparkcore用来指定spark的版本。

为保证 sbt 能正常运行,先执行如下命令检查整个应用程序的文件结构:

技术分享图片

将整个应用程序打包成 JAR(首次运行需要下载依赖包 ):

技术分享图片

打包成功:

技术分享图片

4、运行

将生成的 jar 包通过 spark-submit 提交到 Spark 中运行

技术分享图片

自此完成第一个spark程序

本文源码摘自http://dblab.xmu.edu.cn/blog/1307-2/

第一个spark程序

标签:you   href   new   pre   分享图片   文件结构   cat   图片   ica   

原文地址:https://www.cnblogs.com/suwy/p/9322608.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!