对于Hadoop来说,最主要的是两个方面,一个是分布式文件系统HDFS,另一个是MapReduce计算模型,搭建Hadoop的运行环境主要分为三种:独立模式环境、伪分布式环境、完全分布式环境。
一、独立模式:也叫单机模式。这种模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统的文件系统,没有守护进程,所有程序都运行在同一个JVM中,利于调试和测试,主要用于开发环境。
二、伪分布式:hadoop运行在单机上,但是模拟了一个小的集群,运行在不同的JVM中,用不同的Java进程模仿分布式运行中的各类结点。
(NameNode,DataNode,JobTracker,TaskTracker,SecondaryNameNode)
三、完全分布式:hadoop运行在不同的主机上,也就是运行在一个主机的集群上面,实现了真正的分布式。
下面我分享一下在centOS6.7上搭建独立模式Hadoop 环境的过程(本人亲测有效),另外两种模式的搭建后面逐步更新。
第一步:安装rzsz命令
第二步:创建存放软件包目录
第三步:上传linux版本jdk软件包
第四步:安装jdk
第五步:配置java的环境变量
第六步:上传Hadoop安装软件包
第七步:解压hadoop安装软件并将目录移动到程序目录下
第八步:配置hadoop环境变量
第九步:检测是否成功
如果你看到这个效果,证明你的hadoop已经安装成功。
原文地址:http://jaydenwang.blog.51cto.com/6033165/1763085