一、Mapper类的实现
/**
* KEYIN 即k1 表示行的偏移量
* VALUEIN 即v1 表示行文本内容
* KEYOUT 即k2 表示行中出现的单词
* VALUEOUT 即v2 表示行中出现的单词的次数,固定值1
*/
static class MyMapper extends Mapper{
protected void map(LongWr...
分类:
其他好文 时间:
2015-05-29 10:09:21
阅读次数:
179
使用到Combiner编程(可插拔式)
在map端对输出先做合并,最基本是实现本地key合并,具有本地reduce功能
如果不用combiner,所有结果都是reduce完成,效率会底下
Combiner的的输入输出类型应该完全一致(实现如累加,最大值等功能)
job.setCombinerClass();
倒排索引基本实现
package cn.MapReduce.px;
impo...
分类:
其他好文 时间:
2015-03-28 17:23:38
阅读次数:
128
Hadoop读书笔记(十)MapReduce中的combiner编程。
从计数器分析combiner的作用......
分类:
其他好文 时间:
2014-12-01 22:29:22
阅读次数:
154