码迷,mamicode.com
首页 > 其他好文 > 详细

mapreduce压缩

时间:2018-06-04 11:27:37      阅读:138      评论:0      收藏:0      [点我收藏+]

标签:reducer   磁盘io   特性   增加   reduce   网络io   提高   apr   高性能   

这是mr的一种优化策略,通过压缩编码对mapper或者reducer的输出进行压缩,以减少磁盘io,提高mr运行速度(但也相应增加了cpu运算负担)

特性:

1.mr支持将map输出的结果或者reduce输出的结果进行压缩,以减少网络IO或最终输出数据的体积。

2.压缩特性使用得当能提高性能,但运用不当也可降低性能。

3.基本原则:

运算密集型的job,少用压缩

io密集型的job,多用压缩

 

技术分享图片

也可以设置map端的输出压缩。

技术分享图片

技术分享图片

技术分享图片

mapreduce压缩

标签:reducer   磁盘io   特性   增加   reduce   网络io   提高   apr   高性能   

原文地址:https://www.cnblogs.com/pingzizhuanshu/p/9131607.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!