数据库分库解决方案

时间：2019-12-31 00:48:10 阅读：87 评论：0 收藏：0 [点我收藏+]

当业务数据量非常大，单数据库无法支撑的时候，有可能是单库已经写满了，也可能数据库读写比较频繁，已经触碰到单库的io瓶颈了，这时就需要考虑分库。

下面聊一下该怎么分库，如何优化：

刚开始只有数据库A, 后来又加了数据库B。

假如数据表都是有时间戳字段，而且数据查询条件都带一个时间戳字段，这样我们可以根据数据创建的时间范围来分库，比如给数据库按年份命名db_2019，到2020年新生成一个库db_2020，在业务端进行数据读写操作时，先根据时间戳条件获取到年份，然后选择相应年份的数据库进行操作。

但上面这种方式只适合这种特定的业务场景，而且这种方式，可能旧数据很少读取，新数据会比较频繁读取，会导致不同数据库负载是不均匀的。所以会不会有更好的分片方式呢？答案是肯定的。几乎任何一张表都会有键字段，假如键值是数字类型，可以键值与数据库数量取模的方式进行分片，比如键值是100，数据库数量是2，那么100%2得到0，就应该存储到索引为0的数据库。假如键值是字符串呢，可以通过crc32(value)算出一个数字，然后再通过数字取模的方式得到相应的数据库。

假如在使用过程中，数据库又不够用了，需要再扩容，怎么办？

停服，根据新的分片逻辑进行数据迁移，起服上线新的分片逻辑。没毛病，假如业务允许停机一段时间，这也是一种稳妥方式。假如业务不允许停机，或只允许停机很短的时间，这时该如何数据库扩容呢，或者说该如何平滑地进行数据库迁移而不影响业务呢？

可以通过下面步骤来

方案一：

修改写数据库逻辑：对需要迁移的数据，进行双写（写原数据库和要迁往的数据库）
写一个迁移脚本：从原数据库迁数据到目标数据库
校验原数据库是否跟跟目标数据库数据一致（在迁移的瞬间可能发生了原数据库删除了数据，而目标数据库依然写入），删掉目标数据库多余的数据。
修改数据库分片逻辑，去掉双写逻辑
删掉各个数据库冗余的数据

若数据库双倍分库扩容有更好方案

方案二：

原数据库和要迁往的数据库设计成双主同步
修改数据库分片逻辑
删掉各个数据库冗余的数据

后面找个时间再补充一些图表，以便读者能更直观得理解。

还有一些问题：

问题一：假如方案一中，进行双写的时候一个写成功，一个写失败，该如何处理？

问题二：分库后，如何分页查询数据？

后面会再写一篇较大篇幅的文章分析如何跨数据库分页查询数据。

数据库分库解决方案

标签：设计行数据索引好的不同命名分页开始图表

原文地址：https://www.cnblogs.com/kingson-blog/p/12122211.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行