码迷,mamicode.com
首页 > 其他好文 > 详细

hadoop集群自带WordCount例子

时间:2018-08-21 16:04:41      阅读:277      评论:0      收藏:0      [点我收藏+]

标签:classpath   jar   前置   unix   mapr   删除文件   cat   就是   out   

默认当前位置是hadoop安装包位置

 

jar包:share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.0.jar

一 前置准备

$ cd share/hadoop/mapreduce/

因为这个需要hdfs中的文件,需要掌握基本的hdfs命令 

HDFS基本的文件命令:
    格式: hadoop fs -cmd <args>
    其中,cmd代表具体的文件命令,与unix对应的命令相同,args表示可变的参数。
如,
    hadoop fs    ——获取完整的可用命令列表
    hadoop fs -ls /  ——返回根目录下/user的信息
    hadoop fs -lsr / ——返回根目录下所有文件和子目录
    hadoop fs -put example.txt . ——把本地文件复制到HDFS的默认目录中
    hadoop fs -put example.txt /user/hadoop
    hadoop fs -get example.txt . ——把HDFS中的文件复制到本地
    hadoop fs -cat                      ——在命令行中显示文件内容
    hadoop fs -rm                      ——删除文件
    hadoop fs -rmr                     ——删除目录

hdfs当前默认位置是在user/当前用户 文件夹 ,有些版本可能没有初始化这个文件夹 需要自己创建

$hadoop fs -mkdir /uesr
$hadoop fs -mkdir /uesr/xingluou

本地创建一个文本test用来比较,随便写几个单词

技术分享图片

将这个本地文件复制到hdfs中

$ hadoop fs -put examples/test 

 

二 运行自带的WordCount

$ hadoop jar hadoop-mapreduce-examples-3.1.0.jar wordcount test out

程序运行完后 查看当前hadoop文件  

技术分享图片

发现除了我们自己put进来的test还多生成了一个out目录 

技术分享图片

查看part-r-00000这个文件

技术分享图片

发现就是刚刚文本统计的结果

 

   

 

 三.遇到的问题以及解决方案

    1.运行自带的例子  提示找不到或无法加载主类org.apache.hadoop.mapreduce.v2.app.MRAppMaster

   解决方案:没有classpath导致的  添加classpath即可

   a)hadoop classpath 复制下来打印内容

技术分享图片

   b)编辑 ${HADOOP_HOME}/etc/hadoop/yarn-site.xml 添加yarn.application.classpath,将刚刚查看到的classpath添加即可技术分享图片

 

hadoop集群自带WordCount例子

标签:classpath   jar   前置   unix   mapr   删除文件   cat   就是   out   

原文地址:https://www.cnblogs.com/xingluo/p/9511684.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!