eclipse编写scala应用运行在spark集群上

时间：2017-03-06 23:30:04 阅读：274 评论：0 收藏：0 [点我收藏+]

代码

package spark_1
import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
class WorkCountTest {
//自定义函数
  def jiSuan(){
   
     //数据文件路径
    var loadFile="hdfs://服务器ip:8020/tmp/dataTest/Z";
　　//初始化sparkContext
    var conf=new SparkConf();
    conf.setAppName("workCountZhangxs");
    conf.setMaster("spark://服务器ip:7077")
    var sc=new SparkContext(conf);
   //从hdfs上读取文件
    var fileRdd=sc.textFile(loadFile, 2);
  //过滤出包含执行的字符（"yao"）
   var countRdd=fileRdd.filter(line=>line.contains("yao"));
  //计算出count
   var countF=countRdd.count();
   println(countF)
   sc.stop();
  }
}
object mainA{
 def main(args: Array[String]) {
　　//初始化类
      var t=new WorkCountTest();
　　//调用计算函数
     t.jiSuan();
  
   }
}

输出结果

技术分享

eclipse编写scala应用运行在spark集群上

标签：服务 cli int work style hdfs 编写 imp 过滤

原文地址：http://www.cnblogs.com/zhangXingSheng/p/6512405.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行