标签:
本文的配置环境是VMware10+centos2.5。
在学习大数据过程中,首先是要搭建环境,通过实验,在这里简短粘贴书写关于自己搭建大数据伪分布式环境的经验。
如果感觉有问题,欢迎咨询评论。
一:伪分布式准备工作
1.规划目录

2.修改目录所有者和所属组

3.删除原有的jdk

4.上传需要的jdk包

5.增加jdk 的执行权限

6.解压jdk

7.修改profile的JAVA_HOME,PATH

8.切换至root用户,使文件生效

9.检验jdk是否成功

二:搭建为分布式
1.解压hadoop

2.进入hadoop主目录

3.获取JAVA_HOME的目录

4.修改hadoop-env.sh的JAVA_HOME

5.修改mapred-env.h的JAVA_HOME

6.修改yarn-env.sh的JAVA_HOME

7.配置core-site.xml

8.修改slave的配置

9.修改hdfs.site.xml

10.检验hdfs

11.格式化hdfs


12.启动namenode 以及datanode进程

13.查看浏览器,方便管理HDFS

14.在HDFS上新建文件夹


15.在HDFS上上传文件


16.在HDFS上读取wenjian

17.在HDFS上下载文件到本地

18.配置yarn-site.xml

19.启动resourcemanager与nodemanager

20.在浏览器上运行yarn,方便管理

21..新建将要测试的文件


22.在HDFS上新建文件目录


23.上传本地的wc.input文件进刚刚新建的目录


24.在yarn上运行计算


25.查看结果

三:细节
1.配置历史服务器,修改mapred-xite.xml

2.启动服务器

标签:
原文地址:http://www.cnblogs.com/juncaoit/p/5874568.html