在关系型数据库中,聚合是根据数据记录的某个字段对数据记录进行合并。比如需要从订单明细表统计每个订单的金额,通常需要经过下面几个步骤:
在 MapReduce 中,map 函数所做的包括了上述过程的前两步,其中 emit 函数负责第一步的实现。map 函数最终返回的结果是多个 Key-Values 集合,注意:这里一个键对应多个值,也就是前面说的一个订单号对应多个金额。
接下来,map 的返回值作为 reduce 函数的参数,由 reduce 对每组数据进行合并,也就是上述过程的第三步求和。
MongoDB 聚合之 MapReduce,布布扣,bubuko.com
原文地址:http://www.cnblogs.com/nianhua/p/3746813.html