HBase数据存储格式

时间：2015-07-04 09:40:12 阅读：237 评论：0 收藏：0 [点我收藏+]

标签：hbase

好的数据结构，对于检索数据，插入数据的效率就会非常高。

常见的数据结构

B+树

根节点和枝节点很简单，分别记录每个叶子节点的最小值，并用一个指针指向叶子节点。
叶子节点里每个键值都指向真正的数据块，每个叶子节点都有前指针和后指针，这是为了做范围查询时，叶子节点间可以直接跳转，从而避免再去回溯至枝和根节点。
技术分享

特点：
1、有n棵子树的结点中含有n个关键字，每个关键字不保存数据，只用来索引，所有数据都保存在叶子节点。
2、所有的叶子结点中包含了全部关键字的信息，及指向含这些关键字记录的指针，且叶子结点本身依关键字的大小自小而大顺序链接。
3、所有的非终端结点可以看成是索引部分，结点中仅含其子树（根结点）中的最大（或最小）关键字。

缺点：
通常数据量会很大，磁盘中的数据采用这种分页形式的话，就会比较多。很有可能存储的数据在两个页表当中不连续，相隔很远，这种顺序查询的方式就会比较慢。
B+树最大的性能问题是会产生大量的随机IO。随着新数据的插入，叶子节点会慢慢分裂，逻辑上连续的叶子节点在物理上往往不连续，甚至分离的很远，但做范围查询时，会产生大量读随机IO。
对于大量的随机写也一样，举一个插入key跨度很大的例子，如7->1000->3->2000 … 新插入的数据存储在磁盘上相隔很远，会产生大量的随机写IO。从上面可以看出，低下的磁盘寻道速度严重影响性能。

LSM树

技术分享
为了更好的说明LSM树的原理，下面举个比较极端的例子：
现在假设有1000个节点的随机key，对于磁盘来说，肯定是把这1000个节点顺序写入磁盘最快，但是这样一来，读就悲剧了，因为key在磁盘中完全无序，每次读取都要全扫描；

那么，为了让读性能尽量高，数据在磁盘中必须得有序，这就是B+树的原理，但是写就悲剧了，因为会产生大量的随机IO，磁盘寻道速度跟不上。
LSM树本质上就是在读写之间取得平衡，和B+树相比，它牺牲了部分读性能，用来大幅提高写性能。

它的原理是把一颗大树拆分成N棵小树，它首先写入到内存中（内存没有寻道速度的问题，随机写的性能得到大幅提升），在内存中构建一颗有序小树，随着小树越来越大，内存的小树会flush到磁盘上。当读时，由于不知道数据在哪棵小树上，因此必须遍历所有的小树，但在每颗小树内部数据是有序的。

HBase数据存储格式

HBase引入了LSM树的概念，即Log-Structured Merge-Trees。

HFile格式

技术分享

技术分享
HFile分为六个部分：
Data Block 段
—–保存表中的数据，这部分可以被压缩。每一个数据块由块头和一些KeyValue组成，key的值是严格按照顺序存储的。块大小默认为64K（由建表时创建cf时指定或者HColumnDescriptor.setBlockSize(size)），这一部分可以压缩存储。
在查询数据时，是以数据块为单位从硬盘load到内存。查找数据时，是顺序的遍历该块中的keyValue对。

Meta Block 段 (可选的)
–—保存用户自定义的key-value对，可以被压缩。比如booleam filter就是存在元数据块中的，该块只保留value值，key值保存在元数据索引块中。每一个元数据块由块头和value值组成。可以快速判断key是否都在这个HFile中。

File Info 段
–—-HFile的元信息，不被压缩，用户也可以在这一部分添加自己的元信息。

Data Block Index 段
—-–Data Block的索引，每条索引的key是被索引的block的第一条记录的key（格式为：头信息，（数据块在文件中的偏移 + 数据块长 + 数据块的第一个key），（数据块在文件中的偏移 + 数据块长 + 数据块的第一个key），……..）。
技术分享

Meta Block Index段 (可选的)
–Meta Block的索引。该块组成格式同数据块索引，只是某部分的意义不一样。
技术分享

Trailer
–—这一段是定长的。保存了每一段的偏移量，读取一个HFile时，会首先读取Trailer，Trailer**保存了每个段的起始位置**(段的Magic Number用来做安全check)，然后，DataBlock Index会被读取到内存中，这样，当检索某个key时，不需要扫描整个HFile，而只需从内存中找到key所在的block，通过一次磁盘io将整个 block读取到内存中，再找到需要的key。DataBlock Index采用LRU机制淘汰。
技术分享

说明如下：

1、 FileInfo Offset – FileInfo信息在HFile中的偏移。long(8字节)。
2、 DataIndex Offset – 数据块索引在HFile中的偏移。long(8字节)。
3、 DataIndex Count – 数据块索引的个数。int(4字节)。
4、 MetaIndex Offset – 元数据索引块在HFile中的偏移。long(8字节)。
5、 MetaIndex Count – 元数据索引块的个数。int(4字节)。
6、 TotalUncompressedBytes – 未压缩的数据块部分的总大小。long(8字节)。
7、 Entry Count – 数据块中所有cell（key-value）的个数。int(4字节)
8、 Compression Codec – 压缩算法为enum类型，该值表示压缩算法代码。（LZO-0，GZ-1，NONE-2）,int(4字节)
9、 Version – 版本信息。当前该版本值为1. int(4字节)。

HFile的Data Block，Meta Block通常采用压缩方式存储，压缩之后可以大大减少网络IO和磁盘IO，随之而来的开销当然是需要花费cpu进行压缩和解压缩。目标Hfile的压缩支持两种方式：Gzip，Lzo。

StoreFile格式

技术分享
每个Strore又由一个memStore和0至多个StoreFile组成。
StoreFile以HFile格式保存在HDFS上。

KeyValue对象格式

技术分享

The KeyValue格式:

Keylength
valuelength
key
value

其中keylength和valuelength都是整型，表示长度。
而key和value都是byte数据，key是有固定的数据，而value是raw data。Key的格式如下。

The Key format:

rowlength
row (i.e., the rowkey)
columnfamilylength
columnfamily
columnqualifier
timestamp
keytype

keytype有四种类型，分别是Put、Delete、 DeleteColumn和DeleteFamily。

HBase数据存储格式

标签：hbase

原文地址：http://blog.csdn.net/scgaliguodong123_/article/details/46745825

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行