码迷,mamicode.com
首页 > 其他好文 > 详细

Hive 操作与应用 词频统计

时间:2020-12-10 10:55:10      阅读:3      评论:0      收藏:0      [点我收藏+]

标签:上传   其它   nbsp   文件上传   code   ima   lazy   hdfs   映射   

一、hive用本地文件进行词频统计

1.准备本地txt文件

2.启动hadoop,启动hive

3.创建数据库,创建文本表

4.映射本地文件的数据到文本表中

5.hql语句进行词频统计交将结果保存到结果表中。

6.查看统计结果

技术图片

 

 技术图片

 

 技术图片

 

 技术图片

 

 技术图片

 

 技术图片

二、hive用HDFS上的文件进行词频统计

1.准备电子书或其它大的文本文件

2.将文本文件上传到HDFS上

3.创建文本表

4.映射HDFS中的文件数据到文本表中

5.hql语句进行词频统计交将结果保存到结果表中

6.查看统计结果

技术图片

 

技术图片

 

 

技术图片

 

技术图片

 

 

 

 技术图片

 

Hive 操作与应用 词频统计

标签:上传   其它   nbsp   文件上传   code   ima   lazy   hdfs   映射   

原文地址:https://www.cnblogs.com/CrystalboyWU/p/14091772.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!