码迷,mamicode.com
首页 > 其他好文 > 详细

combiner hadoop

时间:2016-06-11 17:11:45      阅读:142      评论:0      收藏:0      [点我收藏+]

标签:

Combiner用来在map输出之前先做一次合并,减少map和reduce节点之间的数据传输,优化mapreduce。    

Combiner相当于是一个小的reduce,如下所示

map:(key1,value1) ——> list(key2,value2)

combiner:(key2,list(value2)) ——> list(key2,value2)

reduce:(key2,list(value2)) ——> list(key3,value3)

注意一下几点:

1、如果当前集群在很繁忙的情况下job就是设置了也不会执行Combiner。

2、Combiner的输出是Reduce的输入,它绝不会改变最终的计算结果。

3、combiner的数据类型是由reduce决定的,因而输入输出是和reducer一致的。又因为combiner的输出是reducer的输入,所以reducer的输入输出的数据类型要保持一致的时候才能使用combiner,否则报错。 

combiner hadoop

标签:

原文地址:http://www.cnblogs.com/chenyaling/p/5575407.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!