码迷,mamicode.com
首页 > Windows程序 > 详细

Spark API编程动手实战-04-以在Spark 1.2版本实现对union、groupByKey、join、reduce、lookup等操作实践

时间:2015-01-26 11:56:55      阅读:323      评论:0      收藏:0      [点我收藏+]

标签:union   parallelize   groupbykey   join   lookup   

下面看下union的使用:

技术分享

使用collect操作查看一下执行结果:

技术分享

技术分享

再看下groupByKey的使用:

技术分享

执行结果:

技术分享


join操作就是一个笛卡尔积操作的过程,如下示例:

技术分享


对rdd3和rdd4执行join操作:

技术分享


使用collect查看执行结果:

技术分享

技术分享

可以看出join操作完全就是一个笛卡尔积的操作;

reduce本身在RDD操作中属于一个action类型的操作,会导致job的提交和执行:

技术分享

技术分享

下面我们看下lookup的使用:

技术分享

执行结果:

技术分享


Spark API编程动手实战-04-以在Spark 1.2版本实现对union、groupByKey、join、reduce、lookup等操作实践

标签:union   parallelize   groupbykey   join   lookup   

原文地址:http://blog.csdn.net/stark_summer/article/details/43022701

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!