码迷,mamicode.com
首页 > 数据库 > 详细

Mysql和Hadoop+Hive有什么关系?

时间:2019-04-12 10:29:18      阅读:238      评论:0      收藏:0      [点我收藏+]

标签:需要   art   tail   存储   远程   运算   article   方便   分布式系统   

1.Hive不存储数据,Hive需要分析计算的数据,以及计算结果后的数据实际存储在分布式系统上,如HDFS上。

2.Hive某种程度来说也不进行数据计算,只是个解释器,只是将用户需要对数据处理的逻辑,通过SQL编程提交后解释成MapReduce程序,然后将这个MR程序提交给Yarn进行调度执行。所以实际进行分布式运算的是MapReduce程序

3.因为Hive为了能操作HDFS上的数据集,那么他需要知道数据的切分格式,如行列分隔符,存储类型,是否压缩,数据的存储地址等信息。为了方便以后操作所以他需要将这些信息通过一张表存储起来,然后将这张表(元数据)存储到mysql中。为了啥存储到mysql里(实际是远程mysql),因为hive本身就是一个解释器,所以他不存储数据 。

资料连接:https://blog.csdn.net/qq_26442553/article/details/80206562 

Mysql和Hadoop+Hive有什么关系?

标签:需要   art   tail   存储   远程   运算   article   方便   分布式系统   

原文地址:https://www.cnblogs.com/DidiLiu/p/10694366.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!