码迷,mamicode.com
首页 > 其他好文 > 详细

Hive 操作与应用 词频统计

时间:2020-12-10 11:24:10      阅读:6      评论:0      收藏:0      [点我收藏+]

标签:image   创建数据库   启动   文件   上传   保存   mamicode   hive   准备   

一、hive用本地文件进行词频统计

1.准备本地txt文件 

技术图片

 

2.启动hadoop,启动hive

 技术图片

 

 

 3.创建数据库,创建文本表

技术图片

 

 

 4.映射本地文件的数据到文本表中

技术图片

 

 

 5.hql语句进行词频统计交将结果保存到结果表中。

技术图片

 

6.查看统计结果

技术图片

 

 

 

二、hive用HDFS上的文件进行词频统计
1.准备电子书或其它大的文本文件

技术图片

 

2.将文本文件上传到HDFS上

 技术图片

 

 

 

3.创建文本表

技术图片

 


4.映射HDFS中的文件数据到文本表中

 

技术图片

 

5.hql语句进行词频统计交将结果保存到结果表中

 技术图片

 

6.查看统计结果

技术图片

 

技术图片

技术图片

Hive 操作与应用 词频统计

标签:image   创建数据库   启动   文件   上传   保存   mamicode   hive   准备   

原文地址:https://www.cnblogs.com/XRTX/p/14092416.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!