码迷,mamicode.com
首页 > 其他好文 > 详细

MapReduce介绍

时间:2016-06-16 18:18:43      阅读:120      评论:0      收藏:0      [点我收藏+]

标签:mapreduce

一、总体介绍:

Hadoop MapReduce是一个软件框架,可以使用可靠、容错的方式开发在多集群节点(可以是上千个节点)上并行处理大批量数据(TB级)的程序应用。

MapReduce Framework由一个 master JobTracker 和多个 slave TaskTracker(每个集群节点是一个TaskTracker) 组成。mastr负责在slaves节点调度组成作业的任务,监控,并重新执行失败的任务。Slaves节点负责执行任务。

二、输入和输出:

MapReduce的输入和输出都是 key-value对。

(input) <k1, v1> -> map -> <k2, v2> -> combine -> <k2, v2> -> reduce -> <k3, v3> (output)

key和value类都由framework来序列化,因此,它们都需要实现Writable接口。除此之外,为了完成排序功能,key类还需要实现WritableComparable接口。

本文出自 “雪花” 博客,谢绝转载!

MapReduce介绍

标签:mapreduce

原文地址:http://6216083.blog.51cto.com/6206083/1789945

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!