标签:
运行Hadoop
进入Hadoop的安装目录的bin目录下,采用-format命令格式化文件系统。
$Hadoop NameNode -format
注意:在执行格式化-format命令时,要避免NameNode的namespace ID与DataNode的namespace ID
的不一致。这是因为每格式化就会产生Name、Data、temp等临时文件记录信息,
多次格式化就会产生很多的Name、Data、temp,这样容易导致ID的不同,使Hadoop不能正常运行。
每次执行格式化命令是,就需要将DataNode和NameNode上原来的data、temp文件删除。
启动Hadoop,采用start-all.sh命令
start-all.sh
查看进程,采用jps命令
jps
查看集群状态:
hadoop dfsadmin -report
Hadoop的web查看方式:
主机名:50070
主机名:50030
运行wordcount.java程序
准备测试数据
在HDFS中建立一个input目录
hadoop fs -mkdir input
将之前准备的数据文件上传到HDFS中:
hadoop fs -copyFromLocal 准备的文件路径 input
执行wordcount
hadoop jar examples.jar wordcount input output
完成之后查看结果
hadoop -cat output/part-r-0000
标签:
原文地址:http://www.cnblogs.com/tuhooo/p/5480993.html