码迷,mamicode.com
首页 > 其他好文 > 详细

认识Hive

时间:2020-11-21 12:33:40      阅读:7      评论:0      收藏:0      [点我收藏+]

标签:维护   同事   rgba   cli   运行   info   drive   精简   lazy   

  • 认识Hive

  • 从MapReduce到SQL

  • Hive架构

  • 三种安装方式

  • Hive与关系型数据库的区别

1.  认识Hive

前面我们讲到了mapreduce计算框架,各位需要通过java编码的形式来实现设计运算过程,Hive的设计目的就是为了让精通sql技能而java较弱的分析师能够利用hadoop进行各种分析,HiveSQL和SQL非常相似,只需要对SQL熟练即可

2.  从Mapreduce到SQL

Hive的特点

    • 稳定,代码精简,易于维护
    • Hive可以说是Hive(SQL)到Mapreduce的映射器,是对Mapreduce的高度封装
    • Hive可以将用户输入的HiveSQL脚本转化为一个或者多个Mapreduce作业并在集群上运行
    • 技术图片

3.  Hive架构

 Hive与Hadoop的HDFS和Mapreduce计算框架不同,Hive并不是分布式,他是独立在集群之外,可以看做是一个单独的Hadoop的客户端

技术图片

 

 可以ton过CLI(命令接口),HWI(hive网络界面)以及Thrift Server提供的JDBC和ODBC的方式访问Hive,其中最常见的是Hive命令是Hive命令行接口。用户通过以上方式向Hive提交查询命令,而命令会进入Driver模块,通过模块进行解释和变异对需求进行优化完成作业。

Metastore是Hive的元数据的集中存放地,他保存了Hive的元数据信息,也就是表的信息和列的信息。

4.  三种安装方式

4-1:内嵌模式

这是最简单的模式,元数据服务和Hive服务运行在同一个JVM中,同事使用内嵌的Derby数据库作为元数据存储,该模式支持同事最多一个用户打开hive会话

技术图片

4-2:本地模式

元数据服务和hive服务仍在一个JVM中,不同的是采用了外置的MySQL数据库作为元数据存储,该方法支持多个用户同事访问Hive

技术图片

4-3:远程模式

元数据服务和Hive服务运行在不同的进程内,这样的好处是数据库完全置于防火墙之外,客户端登录不需要验证。

 技术图片

 

 5.  Hive与关系型数据库的区别

  • HQL与SQL非常相似,但是Hive和关系型数据库除了查询语句非常相似再无类似之处
  • 技术图片

     

     

认识Hive

标签:维护   同事   rgba   cli   运行   info   drive   精简   lazy   

原文地址:https://www.cnblogs.com/wyk1/p/13996106.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!