标签:ubunt 编译 href clust dns 参考 介绍 hadoop集群 pre
本来我一直想搭建一个hadoop分布式平台,没有高性能机器,也没有那么多机器,搞很很久,都没有能搞定。但基于docker,5-10min轻易搞定。
感谢大神KiwenLau的分享,网址是https://kiwenlau.com/2016/06/12/160612-hadoop-cluster-docker-update/
将Hadoop打包到Docker镜像中,就可以快速地在单个机器上搭建Hadoop集群,这样可以方便新手测试和学习。
如下图所示,Hadoop的master和slave分别运行在不同的Docker容器中,其中hadoop-master容器中运行NameNode和ResourceManager,hadoop-slave容器中运行DataNode和NodeManager。NameNode和DataNode是Hadoop分布式文件系统HDFS的组件,负责储存输入以及输出数据,而ResourceManager和NodeManager是Hadoop集群资源管理系统YARN的组件,负责CPU和内存资源的调度。
之前的版本使用serf/dnsmasq为Hadoop集群提供DNS服务,由于Docker网络功能更新,现在并不需要了。更新的版本中,使用以下命令为Hadoop集群创建单独的网络:
sudo docker network create --driver=bridge hadoop
|
然后在运行Hadoop容器时,使用”–net=hadoop”选项,这时所有容器将运行在hadoop网络中,它们可以通过容器名称进行通信。
项目更新要点:
sudo docker pull kiwenlau/hadoop:1.0
|
git clone https://github.com/kiwenlau/hadoop-cluster-docker
|
sudo docker network create --driver=bridge hadoop
|
cd hadoop-cluster-docker
|
运行结果
start hadoop-master container...
|
./start-hadoop.sh
|
./run-wordcount.sh
|
运行结果
input file1.txt:
|
Hadoop网页管理地址:
192.168.59.1为运行容器的主机的IP。
./resize-cluster.sh 5
|
./start-container.sh 5
|
标签:ubunt 编译 href clust dns 参考 介绍 hadoop集群 pre
原文地址:https://www.cnblogs.com/linwenbin/p/12028170.html