码迷,mamicode.com
首页 > 其他好文 > 详细

大数据-hadoop-MapReduce计算流程

时间:2019-09-21 15:26:11      阅读:96      评论:0      收藏:0      [点我收藏+]

标签:编写   hdf   计算   大数据   line   exp   数据   bsp   apr   

  • MapReduce计算流程

  1  首先是通过程序员所编写的MR程序通过命令行本地提交或者IDE远程提交

  2 一个MR程序就是一个Job,Job信息会给Resourcemanger,向Resourcemanger注册信息

  • 3  在注册通过后,Job会拷贝相关的资源信息(从HDFS中)

    4 紧接着会向Resourcemanger提交完整的Job信息(包括资源信息)

    5a  Resourcemanger 会通过提交的Job信息,计算出Job所需的资源,为Job分配Container资源

    5b 计算资源会分发给对应的NodeManger,NodeManager会创建一个MRAppMaster

    6  MRAppMaster初始化Job

    7 获取输入切片信息

    8 MRAppMaster向ResourceManager 请求资源

    9a 启动计算资源(连接到对应的资源所在NodeManager)

    9b 启动YARN Child

    10 从文件系统中获取完整的Job信息

    11 启动对应的Maptask或者ReduceTask 进程,执行计算。

技术图片技术图片

 

大数据-hadoop-MapReduce计算流程

标签:编写   hdf   计算   大数据   line   exp   数据   bsp   apr   

原文地址:https://www.cnblogs.com/blogs-gxData/p/11562824.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!