码迷,mamicode.com
首页 > 其他好文 > 详细

01_部署Hadoop(伪分布式模式)

时间:2020-05-21 13:13:24      阅读:59      评论:0      收藏:0      [点我收藏+]

标签:shu   创建   abort   hadoop   fine   tps   classpath   安装   伪分布式   

1.Hadoop部署包下载(apache社区版)

1.1下载地址

http://www.apache.org/dyn/closer.cgi/hadoop/common/

技术图片

 

 1.2下载注意(稳定版下载)

技术图片


 

 2.查看部署包内安装手册

2.1解压部署包后,用浏览器打开(hadoop-3.1.3\share\doc\hadoop\index.html)


 

3.准备安装环境

3.1 支撑平台(linux-centos7)

3.2  环境设置

  1.配置免密登入

  2.关闭防火墙

3.2 所需软件

3.2.1 安装jdk

1.版本兼容性 请查看:https://cwiki.apache.org/confluence/display/HADOOP/Hadoop+Java+Versions

2.解压jdk+配置环境变量

3.2.2  安装ssh、pdsh

  $ sudo apt-get install ssh
  $ sudo apt-get install pdsh

 

4.上传、解压hadoop安装包

tar -xvf  hadoop-3.1.3.tar.gz

 

5.修改相关配置文件

5.1 配置 etc/hadoop/hadoop-env.sh

#指定jdk路径
export JAVA_HOME=/home/software/jdk1.8
source /etc/hadoop/hadoop-env.sh

5.2 配置 etc/hadoop/core-site.xml

<!--指定namenode地址-->
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

5.3 配置 etc/hadoop/hdfs-site.xml

<!--指定hdfs保存数据副本的数量,默认为3,伪分布式模式设置为1-->
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

 

6.格式化namenode

$ bin/hdfs namenode -format

 

7.启动hdfs

7.1启动命令

 $ sbin/start-dfs.sh

7.2如果启动失败时报错(but there is no HDFS_NAMENOD_USER defined...)

1.需要在start-dfs.sh和stop-dfs.sh文件中添加下列参数:

#!/usr/bin/env bash
HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

7.3 测试hdfs命令

1.创建目录
bin/hdfs dfs -mkdir /user

2.上传文件
bin/hdfs dfs -put 文件名称 /user

7.4 登入Namenode管理界面

默认地址与端口:http:// localhost:9870 / (确保防火墙关闭或端口开放)

7.5 查看hdfs相关进程

技术图片


 

8.停止hdfs

$ sbin/stop-dfs.sh

 

9.开启yarn(如果不开启,mr在本地运行)

9.1 配置 etc/hadoop/mapred-site.xml

<!--指定mr运行在yarn上 -->
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>mapreduce.application.classpath</name>
        <value>$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/*:$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/lib/*</value>
    </property>
</configuration>

9.2 配置 etc/hadoop/yarn-site.xml

<!--NodeManager获取数据的方式 -->
<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
    </property>
</configuration>

9.3 启动yarn

$ sbin/start-yarn.sh

9.4 启动报错(but there is no YARN_RESOURCEMANAGER_USER defined. Aborting operation)

#对于start-yarn.sh和stop-yarn.sh文件,添加下列参数:

#!/usr/bin/env bash
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

9.5 登入yarn管理界面

默认地址 ResourceManager - http://localhost:8088/ (确保防火墙关闭或端口开放)

9.6 查看yarn相关进程

技术图片

 

 

 

 

 

 

 

 

  

 

 

01_部署Hadoop(伪分布式模式)

标签:shu   创建   abort   hadoop   fine   tps   classpath   安装   伪分布式   

原文地址:https://www.cnblogs.com/bajiaotai/p/12929987.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!