码迷,mamicode.com
首页 > 其他好文 > 详细

MapReduce编程之实例分析:wordCount

时间:2020-05-13 19:46:40      阅读:77      评论:0      收藏:0      [点我收藏+]

标签:包含   put   查看   帮助   strong   程序设计   编程   指定   hadoop   

1.WordCount程序任务

  输入:一个包含大量单词的文本文件

  输出:文件中没个单词及出现的次数(频数),并按照单词顺序排序每个单词和其频数占一行,单词和频数之间有间隔

2.WordCount程序设计思路

  WordCount可以使用MapReduce去做

  在/usr/local/目录下创建WordCount文件夹

  mkdir /usr/local/wordcount

技术图片

   切换到指定文件夹,创建文件

  vim file1.txt   vim file2.txt

技术图片  技术图片

   在Hdfs中创建一个input文件夹

技术图片

   把刚才创建的两个文件上传到input里

  hadoop fs -put *.txt /input

技术图片

   运用wordcount程序

  hadoop的jar文件中默认已帮助我们提供了wordcount程序,都位于/usr/local/hadoop/hadoop-2.8.0/share/hadoop/mapreduce

 技术图片

   #切换目录

  cd /usr/local/hadoop/hadoop-2.8.0/share/hadoop/mapreduce

  #运行jar包程序

  hadoop jar hadoop-mapreduce-examples-2.8.0.jar wordcount /input/ /putout/

  #查看运行结果

  hadoop fs -cat /putout/part-r-00000

技术图片

MapReduce编程之实例分析:wordCount

标签:包含   put   查看   帮助   strong   程序设计   编程   指定   hadoop   

原文地址:https://www.cnblogs.com/ws1149939228/p/12884281.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!