首页 > 其他好文 > 详细

Hadoop学习之MapReduce

时间：2019-10-23 11:15:46 阅读：92 评论：0 收藏：0 [点我收藏+]

标签：框架分而治之布尔文件 mapreduce resource 产生 compare 分解

结构介绍

MapReduce是Hadoop提供的一种处理海量数据的并行编程模型和计算框架，用于对大规模的数据进行并行计算。主要由ResourceManager和NodeManager两类节点构成。
ResourceManager主要负责集群资源管理，NodeManager负责节点的资源管理。
当运行MapReduce任务的时候，后产生ApplicationMaster和Container，其中ApplicationMaster负责向ResourceManager节点进行资源的申请并控制任务的执行，Container是最基本的资源单位。MapReduce的Map和Reduce均是其之上进行运行的。

MapReduce编程思想

MapReduce采用“分而治之”的思想。对大规模的数据集的操作分配给各子节点进行操作，然后通过整合子节点的中间结果得到最终结果。即“任务的分解和结果的汇总”。
Hadoop将这个工作高度抽象成为两个函数，分别为Map和Reduce。Map负责将任务分解为多个任务。Reduce负责将多个Map任务的中间结果合并为最终结果。在此过程中的其他步骤均由Hadoop的MapReduce框架自行负责处理，包括工作调度、任务分配和节点间通信等。

Hadoop数据类型

继承接口Writable实现其方法write()和readFields()，以便该数据能被序列化后完成网络传输或文件输入/输出。
如果该数据需要作为主键key使用或者需要比较值大小时，则需要实现WritableComparable接口，实现其方法write(),readFields(),CompareTo()。

类型	说明
BooleanWritable	标准布尔型数值
ByteWritable	单字节数值
DoubleWritable	双字节数值
FloatWritable	浮点数
IntWritable	整型数
LongWritable	长整型数
Text	使用UTF8格式存储的文本
NullWritable	当<key, value>中的key或value为空时使用

以上为Hadoop中关于MapReduce的一些介绍，具体正在学习ing...

Hadoop学习之MapReduce

标签：框架分而治之布尔文件 mapreduce resource 产生 compare 分解

原文地址：https://www.cnblogs.com/yin1361866686/p/11724967.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！