标签:
HBase是源于Google的Bigtable理念。它的特点是:稀疏,非结构化,列存储,多维度;
稀疏:把一些可能没有关系(从自然界实体的理解上)数据都存储到一张表这样的设计理念的结果就是某些列只在某些行上面有值。比如我们把原本应该在关系数据库中作为不同实体存在而把数据存放在不同的实体表中的“汽车”和“人”存放到一张表里面,那肯定会造成只有“人”在“年龄”字段有值。而对于“汽车”就会出现时空值(NULL)。那么从二维平面上看上去这张表就像土壤一样很稀松的。这就是稀疏的意思。而HBase存储的时候每一行都是可以存储不同的列。列名是“<family>:<label>”。
非结构化:非结构化是指没有具体的数据类型,都是是字符串,字段长度可变(不要求存储固定长度的数据)。但是每一行还是必须有一个用于排序的主键。主键可以是某一列或者列组合。
标签:
原文地址:http://www.cnblogs.com/jenrrychen/p/4983745.html