码迷,mamicode.com
首页 > 其他好文 > 详细

maprduce 中reduce数量

时间:2017-09-04 16:54:41      阅读:160      评论:0      收藏:0      [点我收藏+]

标签:key   one   span   电话号码   public   dict   col   err   red   

    
    @Override
    public int getPartition(Text key, FlowBean value, int numPartitions) {
        String prefix = key.toString().substring(0, 3);
        Integer provinceId = proviceDict.get(prefix);
        
        return provinceId==null?4:provinceId;
    }

在hadoop 默认的是hashpartitioner,简单的例子是用hashcode除以numPartitions的数量,这样在数据均匀的前提下,数据可以被均匀的分到每个reduce中.

还有一种情况是不按照numPartitions而是根据业务来判断的,比如按照订单的类别,将同一类别的订单数据发送到同一个reduce中,将同一个省份的电话号码的数据发送到到同一reduce中

此时在计算式就没有利用numpartiton,在代码中执行reducenumber时也要根据业务场景来指定

maprduce 中reduce数量

标签:key   one   span   电话号码   public   dict   col   err   red   

原文地址:http://www.cnblogs.com/rocky-AGE-24/p/7474293.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!