码迷,mamicode.com
首页 > 其他好文 > 详细

大数据05 MapReduce

时间:2020-02-29 15:01:41      阅读:64      评论:0      收藏:0      [点我收藏+]

标签:image   reduce   img   mic   idt   大数据   次数   分布   ima   

MapReduce: 分布式并行编程, 也就是多台机器的 CPU 之间的并行编程.

技术图片

 

MapReduce 帮你自动实现底层.

技术图片

 

分而治之的策略:

技术图片

 

理念:

 

技术图片

 

技术图片

 

 技术图片

 

 技术图片

 

 技术图片

 

 技术图片

 

 实例:

技术图片

 

两个文件, 统计这两个文件中单词的个数

 技术图片

 

 key:单词, value:出现次数

技术图片

 

reduce: key - value list. 用 Iterable 容器

技术图片

 

 技术图片

 

 技术图片

 

 这里的 Word Count 是类的名称

 技术图片

 

大数据05 MapReduce

标签:image   reduce   img   mic   idt   大数据   次数   分布   ima   

原文地址:https://www.cnblogs.com/moveofgod/p/12382689.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!