启动haoop并运行wordcount

时间：2016-05-11 11:22:39 阅读：217 评论：0 收藏：0 [点我收藏+]

标签：

运行Hadoop

进入Hadoop的安装目录的bin目录下，采用-format命令格式化文件系统。
$Hadoop NameNode -format

注意：在执行格式化-format命令时，要避免NameNode的namespace ID与DataNode的namespace ID
的不一致。这是因为每格式化就会产生Name、Data、temp等临时文件记录信息，
多次格式化就会产生很多的Name、Data、temp，这样容易导致ID的不同，使Hadoop不能正常运行。
每次执行格式化命令是，就需要将DataNode和NameNode上原来的data、temp文件删除。

启动Hadoop，采用start-all.sh命令

start-all.sh

查看进程，采用jps命令
jps

查看集群状态：
hadoop dfsadmin -report

Hadoop的web查看方式：
主机名:50070
主机名:50030

运行wordcount.java程序

准备测试数据

在HDFS中建立一个input目录

hadoop fs -mkdir input

将之前准备的数据文件上传到HDFS中：
hadoop fs -copyFromLocal 准备的文件路径 input

执行wordcount
hadoop jar examples.jar wordcount input output

完成之后查看结果
hadoop -cat output/part-r-0000

启动haoop并运行wordcount

标签：

原文地址：http://www.cnblogs.com/tuhooo/p/5480993.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行