码迷,mamicode.com
首页 > 其他好文 > 详细

Hive的基本理论知识

时间:2020-04-27 15:21:33      阅读:59      评论:0      收藏:0      [点我收藏+]

标签:default   接口   理论知识   def   元数据   驱动   shell   一点   mapr   

Hive是什么?

个人理解是把存储在hdfs上的数据映射位一张数据库表,提供类sql(HQL)语句的查询,方便数据的分析,查询。另外一点就是自动的把HQL转化为MapRudecu、Tez、Spark执行。

Hive的架构

  • 用户接口:可以是hive shell,jdbc(java 访问hive),webUI
  • 元数据:包括表名,表所属的数据库(默认为default)、表拥有者、表类型、列字段,分区字段,表数据所在目录。默认存储在derby中,因为是单线程的所以推荐采用mysql存储metaStore
  • 驱动器包括:
    • 解析器:将sql字符串转换为抽象语法树AST
    • 编译器:将AST编译生成逻辑执行计划
    • 优化器:对逻辑执行计划进行优化
    • 执行器:对逻辑执行计划转化成可运行的物理计划:MR/TEZ/Spark

Hive的基本理论知识

标签:default   接口   理论知识   def   元数据   驱动   shell   一点   mapr   

原文地址:https://www.cnblogs.com/hhachi/p/12786759.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!