首页 > 其他好文 > 详细

HBase原理和架构

时间：2017-10-22 23:35:57 阅读：280 评论：0 收藏：0 [点我收藏+]

标签：插入数据 put 效率 cli hdfs reg png 不用分布式存储

HBase是什么

技术分享

HBase在生态体系中的位置

技术分享

HBase vs HDFS

技术分享

HBase表的特点

技术分享

HBase是真正的分布式存储，存储级别达到TB级别，而才传统数据库就不是真正的分布式了，传统数据库在底层，虽然的存储能力很强，一旦达到上亿条数据。读取性能下降得很快。

传统数据库按行存储，如果列过多的话，一行数据会非常大，HBase按列簇存储，每个列簇都存储一个文件，如果只读取某一些字段的话，只需读取对应的文件就可以了，其他的不用扫描，节省了IO。

HBase的存储每一行的内容可以不同，空出来的列不占用空间。

多版本，怎么理解呢，就比如说相同id的行重新插入数据不会覆盖掉，而是按照插入的时间戳分类。

行存储和列存储

技术分享

02 HBase数据模型

技术分享

HBase逻辑视图

技术分享

Rowkey和Column Family

技术分享

HBase数据模型

技术分享

技术分享

HBase支持的操作

技术分享

03 HBase物理模型

技术分享

传统数据库和HBase的存储的不同

技术分享

技术分享

技术分享

物理存储

技术分享

Table vs Region

技术分享

技术分享

技术分享

04 HBase系统架构

架构图

技术分享

HBase基本组件

技术分享

HBase工作流程

技术分享

Hbase Write-Ahead-Log（预先写日志）

技术分享

Regionserver结构

技术分享

HBase Compact && Split

技术分享

HLog Replay

技术分享

Hfile存储格式

技术分享

Hfile存储格式(续)

技术分享

Keyvalue格式

技术分享

Hlog存储格式

技术分享

HLog存储格式(续)

技术分享

HBase高可用

技术分享

技术分享

HBase容错性

技术分享

Region定位

技术分享

先访问zookeeper,找到root表的位置，root表记录了meta表的位置，在meta表里面查找对应的rowkey查找所在的region,并获取用户region的位置

-ROOT-和.META.表结构

技术分享

如果是root表，表名就是.meta。如果是meta表，表名就是用户的id 订单等等。

-ROOT-表和.META

技术分享

技术分享

Hbase 读流程

技术分享

Client客户端先找到zookeeper拿到meta表，meta表根据rowkey拿到相应的region信息，找到对应的regionsever

技术分享

1.memstore是写缓存，blockcache是读缓存。

2.读数据的时候先到写缓存memstore去读，这样能提高读的效率，当memstore没有了，才到读缓存blockcache读数据。如果上面两个缓存（属于内存）都没有的情况下，就到磁盘去读。

3.在读到磁盘的时候去查找相应的数据，在没找到之前把前面的hfile放到blockcache读缓存里面，因为blockcache的空间也是有限的，如果blockcache读满了还没有找到需要查询的数据，blockcache就会淘汰一部分数据。

HBase put写流程

技术分享

Hbase VS 关系型数据库

技术分享

Hbase VS Hive

技术分享

技术分享

HBase原理和架构

标签：插入数据 put 效率 cli hdfs reg png 不用分布式存储

原文地址：http://www.cnblogs.com/braveym/p/7708332.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！