hbase预分区

时间：2020-06-02 11:27:42 阅读：69 评论：0 收藏：0 [点我收藏+]

技术图片

hbase在创建表的时候，一开始只有一个Region，当数据量越来越大时，此region不能承受数据量，就会进行split

这种方式有两种缺点：1.数据往一个region上写,会有写热点问题

2.region split会消耗宝贵的集群I/O资源

所以引入了预分区概念。

https://blog.csdn.net/javajxz008/article/details/51913471

rowkey的设计：一条数据存储于哪个分区，取决于rowkey处于哪个预分区的区间内，设计rowkey的目的，就是让数据均匀的分布于所有的region中，在一定程度上防止数据倾斜。

rowkey的设计原则：

（1）唯一性原则

（2）长度原则（不能太长，不能太短）（满足查询条件下越短越好）（60-80字节，最大值是64k）

（3）散列原则（rowkey均匀分配）

1.生成随机数，hash,散列值

2.字符串反转（20170524000001-》10000042507102,20170524000002-》20000042507102，散列）

3.字符串拼接（20170524000001-》20170524000001_a12e,20170524000001-》20170524000001_93i7）

原文地址：https://www.cnblogs.com/18800105616a/p/13029688.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行