首页 > 其他好文 > 详细

Hadoop单机模式配置

时间：2018-05-26 15:56:42 阅读：322 评论：0 收藏：0 [点我收藏+]

标签：http log etc 地址临时 yarn tps width mon

一、安装jdk

安装：sudo apt-get install openjdk-7-jdk

配置环境变量：

修改文件 sudo nano /etc/profile ，添加以下内容：

技术分享图片

立即执行使之生效：

二、配置Hadoop

1、下载Hadoop

http://hadoop.apache.org/releases.html

2、解压，目录下几个重要目录

sbin：启动或者停止Hadoop相关服务的脚本

bin：对Hadoop相关服务（HDFS，YARN）进行操作的脚本

etc：Hadoop的配置文件目录

share：Hadoop依赖的jar包和文档，文档可以删掉，jar包不能

lib：Hadoop的本地库（对数据进行压缩解压缩功能的）

3、配置Hadoop单机模式，修改其中5个配置文件

第一个配置文件Hadoop-env.sh：

修改如下：

第二个配置文件core-site.xml：

配置HDFS的地址、协议、端口号和Hadoop运行时产生数据的存储目录，不临时数据

技术分享图片

第三个配置文件hdfs-site.xml：

指定HDFS数据副本数存储量，由于是伪分布式，只有一台机器，所以value为1

技术分享图片

第四个配置文件：

重命名：

指定mapreduce编程模型运行在yarn之上

技术分享图片

第五个配置文件yarn-site.xml：

参数解释https://blog.csdn.net/xiaoshunzi111/article/details/51221139

默认参数http://hadoop.apache.org/docs/r2.4.1/hadoop-yarn/hadoop-yarn-common/yarn-default.xml

mapreduce执行shuffle时获取数据的方式

技术分享图片

4、配置Hadoop环境变量

添加

执行

5、配置ssh免密码

这是单机模式下的，相当于自己访问自己

方法一：

（在输入下面这几个命令之前试过其他方法，遇到很多问题，执行过其他一些操作，最后是找到如下方法操作成功的，但是不知道之前的操作有没有影响）

参考https://blog.csdn.net/budapest/article/details/8022926

生成ssh公钥和私钥

方法二：

（这个方法我没试过，是视频里学的）

命令1：ssh-keygen -t rsa （四个回车）

~/.ssh id-rsa（私钥）、id_rsa.pub（公钥）

命令2：ssh-copy-id localhost

拷贝公钥， ~/.ssh下产生了一个authorized_keys文件，是公钥的配置文件，查看下面两个文件，发现是一样的

技术分享图片

6、格式化hdfs

技术分享图片

报如下的错误，检查发现是mapred-site.xml标签</property>少了斜杠

技术分享图片

修改再重新执行，成功

技术分享图片

7、启动Hadoop

①、启动start-dfs.sh

技术分享图片

启动成功

技术分享图片

浏览器输入127.0.0.1:50070，进入管理界面：

技术分享图片

②、启动start-yarn.sh

技术分享图片

下面这几个缺一不可，必须全部启动才算成功

技术分享图片

浏览器输入127.0.0.1:8088，进入yarn管理界面

技术分享图片

Hadoop单机模式配置

标签：http log etc 地址临时 yarn tps width mon

原文地址：https://www.cnblogs.com/suwy/p/9090565.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！