码迷,mamicode.com
首页 > 其他好文 > 详细

01_Hive简介及其工作机制

时间:2018-07-05 17:15:37      阅读:110      评论:0      收藏:0      [点我收藏+]

标签:结构化   简单   ado   个数   view   数据分析   mapreduce   开发   baidu   

 1.Hive简介

  Hive是一个基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一个表。并提供类SQL查询功能,

可以将sql语句转换为MapReduce任务运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce

统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析

2.数据仓库(面向主题、历史):  

  数据库是用来支撑在线联机业务的。如页面上数据的展示,保存客户操作产生的数据。这类要求变更是实时的、

事务的。

  数据仓库:如果联机数据库中的数据太大了,需要将历史信息导入到离线的仓库中。数据仓库中可以存入各种

业务系统的数据,并按照一定主题来组织这些数据表。数据仓库中的数据一般用来做统计,数据分析。比如统计年

度销售额,月度销售额,广告推荐等

3.Hive的工作机制:

  将清洗过的数据放入到HDFS中,就可进行各种统计了。但有些需求用MapReduce写起来非常难,所以有了Hive

 

01_Hive简介及其工作机制

标签:结构化   简单   ado   个数   view   数据分析   mapreduce   开发   baidu   

原文地址:https://www.cnblogs.com/yaboya/p/9268876.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!