码迷,mamicode.com
首页 > 其他好文 > 详细

启动haoop并运行wordcount

时间:2016-05-11 11:22:39      阅读:217      评论:0      收藏:0      [点我收藏+]

标签:

运行Hadoop

进入Hadoop的安装目录的bin目录下,采用-format命令格式化文件系统。
$Hadoop NameNode -format

注意:在执行格式化-format命令时,要避免NameNode的namespace ID与DataNode的namespace ID
的不一致。这是因为每格式化就会产生Name、Data、temp等临时文件记录信息,
多次格式化就会产生很多的Name、Data、temp,这样容易导致ID的不同,使Hadoop不能正常运行。
每次执行格式化命令是,就需要将DataNode和NameNode上原来的data、temp文件删除。

启动Hadoop,采用start-all.sh命令

start-all.sh

查看进程,采用jps命令
jps


查看集群状态:
hadoop dfsadmin -report

Hadoop的web查看方式:
主机名:50070
主机名:50030

运行wordcount.java程序

准备测试数据

在HDFS中建立一个input目录

hadoop fs -mkdir input

将之前准备的数据文件上传到HDFS中:
hadoop fs -copyFromLocal 准备的文件路径 input

执行wordcount
hadoop jar examples.jar wordcount input output

完成之后查看结果
hadoop -cat output/part-r-0000

启动haoop并运行wordcount

标签:

原文地址:http://www.cnblogs.com/tuhooo/p/5480993.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!