标签:hadoop mapreduce 虚拟机 linux环境配置
首先是spliting吧一个块切割成各种小的
MapReduce的split大小
Max.split(100M)
Min.split(10M)
Block(64M)
Max(min.split, min(max.split,block))
负责调度分配每个子任务taskTracker上,如果发现有失败的task就重新分配其任务到其他节点,每个hadoop集群中只一个JobTracker一般它运行在Master节点上(也就是secondaryNode)
Tasktracker主动与JobTracker通信,接收作业,并负责直接执行每一个任务,为了减少网络带宽TaskTracker最好运行在HDFS的datanode上
我们随意指定一台机器为主JobTracker
我们用node2作为JobTracker
修改配置文件
官网
后面的TaskTracker不用直接配,默认就是其他datanode
吧这个文件发到其他主机上
传好之后
启动
然后我们的第一个节点
也就是我们的JobTracker是
我们其他的datanode是
结果:
版权声明:本文为博主原创文章,未经博主允许不得转载。
标签:hadoop mapreduce 虚拟机 linux环境配置
原文地址:http://blog.csdn.net/cutter_point/article/details/46697651