标签:focus 代码 span serve hive 数据仓库 业务 非关系型数据库 单表
数据仓库,Hive 的本质其实就相当于将 HDFS 中已经存储的文件在Mysql中做了一个双射关系,以方便使用 HQL 去管理查询
用于数据分析、清洗,Hive 适用于离线的数据分析和清洗,延迟较高
基于 HDFS、MapReduce,Hive存储的数据依旧在DataNode上,编写的 HQL 语句终将是转换为MapReduce代码执行
HBase
数据库,是一种面向列存储的非关系型数据库
用于存储结构化和非结构化的数据,适用于单表非关系型数据的存储,不适合做关联查询,类似 JOIN 等操作
基于HDFS,数据持久化存储的体现形式是 Hfile,存放于 DataNode 中,被ResionServer 以 region 的形式进行管理
延迟较低,接入在线业务使用,面对大量的企业数据,HBase 可以直线单表大量数据的存储,同时提供了高效的数据访问速度
Hive
标签:focus 代码 span serve hive 数据仓库 业务 非关系型数据库 单表
原文地址:https://www.cnblogs.com/xiangyuguan/p/11302263.html