码迷,mamicode.com
首页 > 其他好文 > 详细

【Hadoop】10、Hadoop的mapreduce搭建

时间:2015-06-30 18:28:22      阅读:102      评论:0      收藏:0      [点我收藏+]

标签:hadoop   mapreduce   虚拟机   linux环境配置   

Hadoop的mapreduce搭建

 

MapReduce

 

首先是spliting吧一个块切割成各种小的

 

MapReduce的split大小

Max.split(100M)

Min.split(10M)

Block(64M)

Max(min.split, min(max.split,block))

 

 

 

 

MapReduce的架构

 

主多从结构

 

主JobTracker:

         负责调度分配每个子任务taskTracker上,如果发现有失败的task就重新分配其任务到其他节点,每个hadoop集群中只一个JobTracker一般它运行在Master节点上(也就是secondaryNode)

 

从TaskTracker

 

         Tasktracker主动与JobTracker通信,接收作业,并负责直接执行每一个任务,为了减少网络带宽TaskTracker最好运行在HDFS的datanode上

开始搭建

 

我们随意指定一台机器为主JobTracker

 

我们用node2作为JobTracker

 

 

修改配置文件

技术分享

官网

 技术分享

技术分享 

 

后面的TaskTracker不用直接配,默认就是其他datanode

 

吧这个文件发到其他主机上

 技术分享技术分享技术分享

 

传好之后

启动

技术分享

 

然后我们的第一个节点

也就是我们的JobTracker是

 技术分享

 

我们其他的datanode是

 

技术分享

 

 技术分享

 

结果:

 

技术分享技术分享

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

版权声明:本文为博主原创文章,未经博主允许不得转载。

【Hadoop】10、Hadoop的mapreduce搭建

标签:hadoop   mapreduce   虚拟机   linux环境配置   

原文地址:http://blog.csdn.net/cutter_point/article/details/46697651

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!