一、概述
随着时间和业务的发展,数据库中表的数据量会越来越大,相应地,数据操作,增删改查的开销也会越来越大。因此,把其中一些大表进行拆分到多个数据库中的多张表中。
另一方面,在分库分表以后还需要保证分库分表的和主库的事务一致性
二、需要解决问题
2.1 事务问题
由于分库分表之后,新表在另外一个数据库中,如何保证主库和分库的事务性是必须要解决的问题。通过在主库中创建一个流水表,把操作数据库的逻辑映射为一条流水记录。当整个大事务执行完毕后(流水被插入到流水表),然后通过其他方式来执行这段流水,保证最终一致性。
2.2 流水
上面通过在数据库中创建一张流水表,使用一条流水记录代表一个业务处理逻辑,因此,一个流水一定是能最终正确执行的.因此,当把一段业务代码提取流水中必须要考虑到:
- 流水延迟处理性。流水不是实时处理的,而是用过流水执行器来异步执行的。因此,如果在原有逻辑中,需要特别注意后续流程对该流水是不是有实时依赖性(例如后续业务逻辑中会使用流水结果来做一些计算等)。
- 流水处理无序性。保证即使后生成的流水先执行,也不能出现问题。
- 流水最终成功性。对每条插入的流水,该条流水一定要保证能执行成功
因此,提取流水的时候:
- 流水处理越简单越好
- 流失处理依赖越少越好
- 提取的流水在该业务逻辑中无实时性依赖
2.3 流水处理器
流水处理器即要保证流水处理尽可能处理快,又能保证流水最终能执行成功。
设想一个场景:当出现某一条流水处理失败,如果流失执行器要等当前流水执行成功才继续往后执行,那么会影响后续流水的执行,更严重的是一直卡在当条记录,导致整个系统出现问题
因此,流水执行器中设置2个任务:
- 第一个任务,流水处理任务,已最快的速度执行流水,如果流水处理失败了,也不影响后面流水处理
- 第二个任务,流水校验任务,这个任务就是顺序检查流水记录,保证所有流水都执行成功,如果失败,进行重试,多次重试失败以后发出告警以让人工介入处理。
2.4 如何表示流水处理完成
因为流水表是放在原数据库中,而流水处理完成后是操作分库,如何保证流水状态的更新和分库也是在一个事务的?
在分库中创建一个流水表,当流失处理完成以后,不是去更新老表状态,而是插入分库流水表中,
这样只要比较原数据库和分库的流水,就能流水处理结果
如果所有流水处理成功,那么主库中的流水表记录,分库中都存在对应的
三、流水处理器基本框架
流水处理器其实不包含任何业务相关的处理逻辑,核心功能就是:
- 通知业务接入方何时处理什么样的流水
- 检验流水执行的成功
注:流水执行器并不知道该流水表示什么逻辑,具体需要业务系统去识别后去执行相对应业务逻辑。
3.1 流水执行任务
流水处理调度任务就是通过扫描待处理的流水,然后通知业务系统该执行哪一条流水。
示意图如下:
3.2 流水校验任务
流水校验任务就是要比较主库和分库中的流水记录,对执行未成功的流水通知业务系统进行重新处理,如果多次重试失败则发出告警。
流程示意图: