Hive数据仓库

时间：2015-05-21 22:25:38 阅读：181 评论：0 收藏：0 [点我收藏+]

标签：

Hive 是一个基于Hadoop分布式文件系统(HDFS)之上的数据仓库架构，同时依赖于MapReduce。适用于大数据集的批处理，而不适用于低延迟快速查询。

Hive将用户的HiveQL语句转换为MapReduce作业提交到Hadoop集群上，监控执行过程，最后返回结果给用户。由于Hive的元数据(Hive仓库本身的数据信息)需要不断更新、修改、读取，而由于Hadoop存在较高的延时以及作业调度的开销，因此将Hive元数据存在关系型数据库Mysql、derby中。

Hive数据仓库

标签：

原文地址：http://www.cnblogs.com/universe42/p/Hadoop.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行