码迷,mamicode.com
首页 > 其他好文 > 详细

Hbase入门

时间:2018-09-16 16:10:56      阅读:129      评论:0      收藏:0      [点我收藏+]

标签:机器数   区别   重要   类型   海量数据   ase   查询   不同   rdbms   

Hbase入门

简介

HBase是一个构建在HDFS之上的,分布式的,面向列的开源数据库,由Google BigTable的开源
实现,它主要用于存储海量数据,是Hadoop生态系统中的重要一员。

HBase的优势

成熟

  1. 社区成熟
  2. 理论充分经过实践
  3. 丰富的工具支持

高效

  1. 将随机读写转化为顺序读写,适应高并发写入
  2. 均衡效果好读写性能和机器数保持线性相关
  3. 行中没有保存数据的列不占存储空间

分布式特性

  1. 基于HDFS、Zookeeper
  2. 一致性、可用性、分区容忍性
  3. 大数据存储
  4. 易扩展

HBase的特点

  1. 大:一个表可以有数十亿行,上百万列
  2. 面向列:面向列(族)的存储和权限访问,列(族)独立索引
  3. 稀疏:对于为空(null)的列,并不占用存储空间,因此,表可以设计的非常稀疏。
  4. 数据类型单一:HBase中的数据类型都是字符串(string)
  5. 无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态增加,同一张表中不同的行可以有截然不同的列

HBase和RDBMS的区别

  1. 数据类型:HBase中的数据都是字符串类型(String)
  2. 数据操作:HBase只有普通的增、删、改、查等操作,没有表之间的关联查询,如果想进行关联查询的话,可以自己写MapReduce
  3. 存储模式:HBase是基于列式存储的,而RDBMS是基于行式存储的
  4. 应用场景:HBase适合存储大量数据,查询效率极高,HBase自带索引,即使是在上亿的数据中,也可以保证查询数据在毫秒以内。

Hbase入门

标签:机器数   区别   重要   类型   海量数据   ase   查询   不同   rdbms   

原文地址:https://www.cnblogs.com/liaozhilong/p/9655194.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!