码迷,mamicode.com
首页 > 其他好文 > 详细

Spark学习三:Spark Schedule以及idea的安装和导入源码

时间:2016-05-01 01:12:33      阅读:241      评论:0      收藏:0      [点我收藏+]

标签:

Spark学习三:Spark Schedule以及idea的安装和导入源码

标签(空格分隔): Spark


一,RDD操作过程中的数据位置

[hadoop001@xingyunfei001 spark-1.3.0-bin-2.5.0]$ bin/spark-shell --master local[2]

val rdd = sc.textFile(“xx”, 2)
rdd.flatMap(.split(“\t”)).map((, 1)).reduceByKey((_ + _)).saveAsTextFile

Stage-01
part-01 -> Task-01 : rdd.flatMap(.split(“\t”)).map((, 1)).reduce
part-02 -> Task-02 :rdd.flatMap(.split(“\t”)).map((, 1)).reduce
Stage-02
part-01 -> Task-01 :ByKey((_ + _)).saveAsTextFile
part-02 -> Task-02 :ByKey((_ + _)).saveAsTextFile

rdd.cache

技术分享

二,Spark Schedule

技术分享

技术分享

技术分享

三,Idea导入spark源码

1,bin/idea.sh打开idea(进入时进度条点击取消)

2,集成maven

技术分享

3,导入源代码
技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

Spark学习三:Spark Schedule以及idea的安装和导入源码

标签:

原文地址:http://blog.csdn.net/youfashion/article/details/51288776

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!