码迷,mamicode.com
首页 > 其他好文 > 详细

4、MapReduce思想、运行机制

时间:2018-12-17 14:30:40      阅读:198      评论:0      收藏:0      [点我收藏+]

标签:链接   读取   pre   分享   shuffle   扩展   计算   out   map   

MapReduce 离线计算框架


分而治之

  • input > map > shuffle > reduce > output
  • 分布式并行的计算框架
将计算过程分为两个阶段,Map和Reduce
  • Map阶段并行处理输入数据
  • Reduce阶段对Map结果进行汇总
Shuffle链接Map和Reduce两个阶段
  • Map Task将数据写入到本地磁盘
  • Reduce Task从每个Map Task上读取一份数据
仅适合离线批处理
  • 具有很好的容错性和扩展性
  • 适合简单的批处理任务
缺点明显
  • 启动开销大、过多使用磁盘导致效率低下等

MapReduce on YARN


技术分享图片

4、MapReduce思想、运行机制

标签:链接   读取   pre   分享   shuffle   扩展   计算   out   map   

原文地址:https://www.cnblogs.com/Grand-Jon/p/10130520.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!