码迷,mamicode.com
首页 > 其他好文 > 详细

寒假学习进度-3

时间:2020-01-17 22:55:25      阅读:91      评论:0      收藏:0      [点我收藏+]

标签:进度   常用   csdn   类型   键值   atm   不同的   生成   编程   

RDD编程初级实践

函数名 目的 示例 结果
reduceByKey(f) 合并具有相同key的值 rdd.reduceByKey( ( x,y) => x+y ) { (1,2) , (3,10) }
groupByKey() 对具有相同key的值分组 rdd.groupByKey() { (1,2) , (3, [4,6] ) }
mapValues(f) 对键值对中的每个值(value)应用一个函数,但不改变键(key) rdd.mapValues(x => x+1) { (1,3) , (3,5) , (3,7) }
combineByKey( createCombiner, mergeValue, mergeCombiners, partitioner) 使用不同的返回类型合并具有相同键的值 下面有详细讲解 -
flatMapValues(f) 对键值对RDD中每个值应用返回一个迭代器的函数,然后对每个元素生成一个对应的键值对。常用语符号化 rdd.flatMapValues(x => ( x to 5 ))
{ (1, 2) , (1, 3) , (1, 4) , (1, 5) , (3, 4) , (3, 5) }

keys() 获取所有key rdd.keys() {1,3,3}
values() 获取所有value rdd.values() {2,4,6}
sortByKey() 根据key排序 rdd.sortByKey() { (1,2) , (3,4) , (3,6) }
原文链接:https://blog.csdn.net/hsg77/article/details/87277040

寒假学习进度-3

标签:进度   常用   csdn   类型   键值   atm   不同的   生成   编程   

原文地址:https://www.cnblogs.com/liujinxin123/p/12207519.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!