码迷,mamicode.com
首页 > 数据库 > 详细

为什么分布式数据库中不使用uuid作为主键?

时间:2018-04-26 12:12:29      阅读:231      评论:0      收藏:0      [点我收藏+]

标签:EDA   聚集   linu   linux   基本   完全   nbsp   atomic   系统   

 分布式数据库当然也有主键的需求,但是为什么不直接使用uuid作为主键呢?作为曾经被这个问题困惑过的人,试着回答一下

 

1. UUID生成速率低下

Java的UUID依赖于SecureRandom.nextBytes方法,而SecureRandom又依赖于操作系统提供的随机数源,

在Linux系统下,它的默认依赖是/dev/random,而这个源是阻塞的。

最可怕的是,这个nextBytes方法还是一个synchronized方法,也就是说,如果多线程调用UUID,生成速率不升反降。

测试结果:在一台64线程的服务器上,调用UUID.randomUUID方法,生成一千万个uuid平均耗时在130s,tps不到8w

 

2. UUID主键在innodb中会引发性能问题

a. innodb中的主键索引也是聚集索引,如果插入的数据是顺序的,那么b+树的叶子基本都是满的,缓存也可以很好的发挥作用。

如果插入的数据是完全无序的,那么叶子节点会频繁分裂,缓存也基本无效了。这会减少tps

b. uuid占用的空间较大

 

3. UUID完全没有意义,如果有一个主键是全局自增的,那么数据排列顺序就是数据的插入顺序

 

解决方案:

1. 分布式全局序列生成(使用zk的DistributedAtomicLong,一次自增一个步长,用户用完了步长内的序列,再找zk要)

2. Twitter的snowflake算法

 

 

当然自增序列也不是完美的,因为在极大并发的情况下,按自增主键插入会发生争用,主键的上界会出现热点。但总的来说,还是可以接受的

 

出处:

为什么分布式数据库中不使用uuid作为主键?

为什么分布式数据库中不使用uuid作为主键?

标签:EDA   聚集   linu   linux   基本   完全   nbsp   atomic   系统   

原文地址:https://www.cnblogs.com/yuyutianxia/p/8949897.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!