标签:直接 com size 区别 逻辑 lock shu shuf lis
reduceByKey:按照key进行聚合,在shuffle之前有combine(预聚合)操作,返回结果是RDD[k,v]
groupByKey:按照key进行分组,直接进行shuffle
建议使用reduceByKey。但是需要注意是否会影响业务逻辑
标签:直接 com size 区别 逻辑 lock shu shuf lis
原文地址:https://www.cnblogs.com/xiangyuguan/p/11456759.html