码迷,mamicode.com
首页 > 其他好文 > 详细

Hive

时间:2018-08-18 21:21:41      阅读:157      评论:0      收藏:0      [点我收藏+]

标签:执行   etl   oop   仓库   语法分析   mapreduce   mapper   自定义   reducer   

数据仓库

Hive是建立在Hadoop HDFS上的数据仓库基础架构

Hive可以用来进行数据提取转化加载(ETL)

Hive定义了见到那的类似SQL查询语言,称为HQL它允许熟悉SQL的用户查询数据

Hive允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作

Hive是SQL解析引擎,他将SQL语句转移成M/R Job然后在Hadoop执行

Hive的表其实就是HDFS的目录/文件

Hive的体系节后

Hive的元数据:Hive将元数据存储在数据库中(metastore),支持mysql,derby等数据库。

Hive中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等

一条HQL语句如何在hive中进行查询的?

解释器、编译器、优化器完成HQL查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询记录存储在HDFS中,并在随后有MapReduce调用执行

 

Hive

标签:执行   etl   oop   仓库   语法分析   mapreduce   mapper   自定义   reducer   

原文地址:https://www.cnblogs.com/hotMemo/p/9498552.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!