Hadoop基础

时间：2016-05-11 01:19:03 阅读：142 评论：0 收藏：0 [点我收藏+]

标签：

Hadoop组成

包括两个核心组成：
HDFS：分布式文件系统，存储海量的数据
MapReduce：并行处理框架，实现任务分解和调度

搭建大型数据仓库，PB级数据的存储、处理、分析、统计等业务
（搜索引擎、日志分析、商业智能、数据挖掘）

安装Java JDK

1,进入Sshell，检测是否安装java
2，选择安装openjdk-7-jdk
3,进入环境变量修改页面，vi /etc/profile

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64/
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=$JAVA_HOME/lib/:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

保存退出，并设置生效source /etc/profile

Hadoop安装

下载地址，完成解压缩tar -zxvf

1，进入conf文件夹，查看JAVA_HOME位置echo $JAVA_HOME

2，进入配置页面vi hadoop.env.sh，

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64

保存退出。

3，配置core-site.xml文件

<configuration>
 <property>
    <name>hadoop.tmp.dir</name>
    <value>/hadoop</value>
 </property>

 <property>
    <name>dfs.name.dir</name>
    <value>/hadoop/name</value>
 </property>

 <property>
    <name>fs.default.name</name>
    <value>hdfs://ubuntu:9000</value>    #ubuntu为主机名，通过hostname命令查找
 </property>
</configuration>

配置hdfs-site.xml文件

<configuration>
 <property>
      <name>dfs.data.dir</name>
      <value>/hadoop/data</value>
 </property>
</configuration>

配置mapred-site.xml文件

<property>
<name>mapred.job.tracker</name>
<value>ubuntu:9001</value>
</property>

4，配置Hadoop环境变量
进入/etc/profile，添加

export HADOOP_HOME=/opt/hadoop-1.2.1
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/bin:$PATH

设置生效source /etc/profile

5，格式化操作
进入bin目录，hadoop namenode -format
运行start-all.sh，
查看运行内容jps

设置ssh无密码登陆

1，cd ~/.ssh（进入ssh文件夹）
2，ssh-keygen -t rsa（生成rsa密钥）
3，cp id_rsa.pub authorized_keys（复制公钥并改名为authorized_keys）
4，ssh localhost（无密码登陆主机）

Hadoop基础

标签：

原文地址：http://www.cnblogs.com/hanqing/p/5479861.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行