计算机系统因磁盘、电源、软件等的原因发生故障时,会造成数据库系统信息的丢失。此外,事务也可能因各种原因失败,如破坏了完整性约束或发生了死锁。数据库系统的一个重要组成部分就是恢复机制,它负责检测故障以及将数据库恢复至故障发生前的某一状态。
一旦故障发生,数据库系统的状态可能不再一致,即它不能反映数据库试图保存的现实世界的状态,为保持一致性,要求每个事务都必须是原子的。恢复机制的职责就是要保证原子性和持久性。
一、在基于日志的机制中,所有的更新都计入日志,并存放在稳定存储器中。当事务的最后一个日志记录(即commit日志记录)输出到稳定存储器时,就认为这个事务已提交。
日志记录包括所有更新过的数据项的旧值和新值。当系统崩溃后需要对更新进行重做时,就使用新值,如果需要回滚事务,就使用旧值。
在延迟修改机制中,事务执行时所有write操作要延迟到事务提交时才执行,那时系统在执行延迟写中会用到日志中与该事务有关的信息。在延迟修改机制中,日志记录不需要包含已更新的数据项的旧值。
为了减少搜索日志和重做事务的开销,还可以使用检查点技术。在恢复阶段,只需重演自最后一个已完成的检查点之后的正常操作中所做的所有动作。
恢复机制的高效实现需要尽可能减少向数据库和稳定存储器写出的数目。在事务处理所基于的存储模型中,主存储器中有一个日志缓存区、一个数据库缓存区和一个系统缓存区。日志记录在开始时可以保存在易失性的日志缓存区中,当是下述情况之一发生时必须写到稳定存储器中:
在<T, commit>日志记录可以输出到稳定存储器之前,与事务T相关的所有日志记录必须已经输出到稳定存储器中。
在主存中的一个数据库输出到非易失性存储器中的数据库之前,与该块中数据相关的所有日志记录必须已经输出到稳定存储器中。
二、为从造成非易失性存储器中数据丢失的故障中恢复,则必须周期性地将整个数据库的内容转储到稳定存储器中(如每天一次)。如果发生了导致物理数据库丢失的故障,就使用最近一次的转储将数据库恢复到前面的某个一致状态。一旦完成该恢复,再用日志将数据库恢复到最近的一致状态。
远程备份系统提供了更高程度的可靠性,允许事务处理即使在主站点遭受火灾、洪水或地震等破坏时也能继续。主站点上的数据和日志记录连续不断地备份到远程备份站点。如果主站点发生故障,远程备份站点就执行一定的恢复动作,然后接管事务处理。
学习资料:Database System Concepts, by Abraham Silberschatz, Henry F.Korth, S.Sudarshan