1.1伪分布式安装

时间：2018-09-10 00:52:58 阅读：231 评论：0 收藏：0 [点我收藏+]

标签：运行环境 java进程 setting ado format apr 变量 id_rsa abi

以下的安装说明适用于Mac、Hadoop2.9.0

一、安装前提

支持的平台

GNU/Linux可以作为开发、生产运行环境，在GNU/Linux部署的集群可以支持2000+个节点。

也支持windows平台。
依赖的软件

Java，Hadoop2.7以上版本要求Java版本7以上；

安装了ssh，并且sshd是运行状态，hadoop脚本需要使用ssh远程管理Hadoop后台进程。

二、下载安装包

下载地址：http://www.apache.org/dyn/closer.cgi/hadoop/common/

三、安装

1、准备

解压缩hadoop-2.9.0.tar.gz

配置Java环境变量

修改etc/hadoop/hadoop-env.sh ，添加如下内容：

# set to the root of your Java installation    
export JAVA_HOME=/usr/java/latest

JAVA_HOME需要根据本机的实际路径进行配置，如：

执行如下命令，查看hadoop脚本的使用说明

$ bin/hadoop 
Usage: hadoop [--config confdir] [COMMAND | CLASSNAME] 
  CLASSNAME            run the class named CLASSNAME 
 or 
  where COMMAND is one of: 
  fs                   run a generic filesystem user client 
  version              print the version 
  jar <jar>            run a jar file 
                       note: please use "yarn jar" to launch 
                             YARN applications, not this command. 
  checknative [-a|-h]  check native hadoop and compression libraries availability 
  distcp <srcurl> <desturl> copy file or directories recursively 
  archive -archiveName NAME -p <parent path> <src>* <dest> create a hadoop archive 
  classpath            prints the class path needed to get the 
                       Hadoop jar and the required libraries 
  credential           interact with credential providers 
  daemonlog            get/set the log level for each daemon 
  trace                view and modify Hadoop tracing settings 
 
Most commands print help when invoked w/o parameters.

四、配置

hadoop支持三种运行模式：

本地（独立）模式：Local (Standalone) Mode

伪分布式模式：Pseudo-Distributed Mode

分布式模式：Fully-Distributed Mode

伪分布式模式配置

Hadoop支持单节点运行伪分布式模式集群，hadoop后台进程在各自单独的Java进程里运行。

1.配置HDFS

etc/hadoop/core-site.xml:

etc/hadoop/hdfs-site.xml:

<configuration> 
    <property> 
        <name>dfs.replication</name> 
        <value>1</value> 
    </property> 
</configuration>

2.配置ssh无密码登录

上面提到，hadoop脚本需要使用ssh远程管理Hadoop后台进程。所以，即使是伪分布式模式，如果没有配置无密码登录，那么每次启动hadoop服务，都会要求输入用户密码。

执行下面的命令，如果提示输入密码，需要继续配置，否则已经配置了无密码登录。

执行下面的命令，配置ssh无密码登录：

说明：authorized_keys文件的权限必须是0600。

3.启动HDFS并测试

3.1 格式化文件系统

3.2 启动NameNode、DataNode

$ sbin/start-dfs.sh

日志默认路径：$HADOOP_LOG_DIR，缺省路径：$HADOOP_HOME/logs。

3.3 通过web界面查看NameNode：

默认地址：http://localhost:50070/

3.4 创建执行MapReduce job需要的HDFS目录：

3.5 复制文件到分布式文件系统：

$ bin/hdfs dfs -put etc/hadoop input

3.6 运行样例：

3.7 查看样例运行结果：

复制到本地查看

或者直接在分布式文件系统中查看：

3.8 可以运行下面的命令关闭dfs：

4.YARN单节点模式配置

4.1 配置etc/hadoop/mapred-site.xml:

etc/hadoop/yarn-site.xml:

4.2 启动ResourceManager、NodeManager：

4.3 通过web界面查看ResourceManager：

默认地址：http://localhost:8088/

4.4 可以运行下面的命令关闭YARN后台进程：

$ sbin/stop-yarn.sh

1.1伪分布式安装

标签：运行环境 java进程 setting ado format apr 变量 id_rsa abi

原文地址：https://www.cnblogs.com/pugongying017/p/9616095.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行