标签:
遗留的一个.net项目,偶尔会出现一些比较诡异的问题,最近腾出功夫经过排查发现是由死锁引起,下面是一张利用SQL Server Profiler追踪到的死锁状况图:
看到这张图,说实话真是醉了,一个业务上还不算复杂的系统出现这么复杂的死锁挺罕见的,引起此问题的原因很简单,就是该系统将90%的业务写在了存储过程,几乎每一步操作都需要反复的操作表来完成,结果导致偌大的服务器内存利用率永远在20%以下,CPU瞬时压力巨大,没有日志,查找bug也变得异常艰难,由于这种架构设计问题,从业务角度来修改似乎是不可能了,只能找一些临时凑合的解决方案,比如修改隔离级别,死锁超时时间等,关于这种由存储过程构成的架构方案不想多说,想必很多架构设计人员不会去这么设计,借此想写点关于数据库事务隔离级别、锁的基础内容,本文就以微软的SqlServer数据库为主。
造成死锁的必要条件,是在并发环境下,两个(或多个)进程对同一个资源竞争造成的,如上图,椭圆表示进程,矩形表示资源,可以看出是多个进程均占有Batch这张表造成了死锁,解决此问题必须先要搞清楚为什么会有锁以及锁的基本知识。
在实际业务处理中,需要很多步动作连贯完成,比如最经典的银行转账,A给B转100元,必须要保证先从A账户减去100,然后在B账户加100,这个动作是不能间断的,从程序角度看,为了保证这个动作完成,诞生了事务,事务有四个特性ACID,但事务仅仅只是一个概念,他不是具体的技术手段,那需要具体怎么做才能保证事务ACID四个特性呢?关系型数据库一般通过事务日志和锁的手段实现,事务日志保证了原子性、一致性,事务日志是由数据库自行完成,因此一般开发人员接触不到事务日志,大概原理,就是在进行一切实际数据操作之前,都先写好日志,如果数据库发生意外(比如断电)后,及时可以通过日志来自行恢复。锁则保证了隔离性,保证多个事务能够按照串行化的方式请求同一数据。
但现实世界是,很多操作需要并行,简单粗暴的将所有操作(增删改查)通过锁来串行化运行必然行不通,因此需要更精细化来锁定资源,从两个方面入手,第一,针对锁下手,增加锁的类型:共享锁(S)、独占锁(X),还有一个特殊的更新锁(U),还有几乎不接触的意向锁、架构锁等,针对每个锁的解释请参见《锁模式》,他们之间是否兼容的情况请看《锁兼容性》;第二,针对锁资源范围(锁粒度),共有11个粒度,针对每个粒度的说明,MSDN有更详尽的资料,这里就不再粘贴,附上链接:《锁粒度和层次》。至于平时我们经常看到的乐观锁和悲观锁,可以参考Hibernate中的相关内容,文尾附了几篇文章,可供参考。
一般来说,实际开发中,直接操作数据库中各种锁的几率相对比较少,更多的是利用数据库提供的四个隔离级别,未提交读、已提交读、可重复读、可序列化,还有一个特殊的基于行版本的已提交读隔离级别,把它也可以归到已提交读内,基于行版本的隔离级别就是乐观锁的处理方式。那隔离级别和锁是什么关系?通俗来说,隔离级别是锁的一个整体打包解决方案,我的理解是隔离封装了锁。针对这四种隔离,他们有各自的优点和缺点,如下表:
隔离级别 |
脏读 |
丢失更新 |
不可重复读 |
幻读 |
未提交读:Read Uncommited |
是 |
是 |
是 |
是 |
已提交读:Read commited |
否 |
是 |
是 |
是 |
可重复读:Repeatable Read |
否 |
否 |
否 |
是 |
可串行读:Serializable |
否 |
否 |
否 |
否 |
表来自:http://blog.csdn.net/shuaihj/article/details/14163713
从表来看,隔离级别从上到下依次增加,级别越低,引起的问题也就比较多,比如脏读、丢失更新等,但等级越高,也就意味着需要管理更多的锁,无法并行处理,性能方面又受损,因此,我们在设计系统时,只需要根据业务需求选择一种当下适合的隔离级别。一种隔离级别,就有一套利用锁的方案,如此设计,目的就是为了平衡性能和功能。
如何选择一种合适的隔离级别,首选需要了解脏读、丢失更新、不可重复读和幻读的引发的问题,有篇文章举得例子不错,移步:《事务之间的相互影响》,看完这篇文章中的例子,大多数人基本就明白了,下面是用自己语言总结的:
脏读:事务A读到事务B尚未提交的修改(update,Insert,Delete)记录后,事务B回滚了,事务A读取到的就是不存在的数据;
不可重复读:事务A第一次读取后,事务B进行了修改(Delete、Update),再当事务A读取时,发现数据在一个事务中前后不一;
幻读:和不可重复读类似,但幻读针对Insert操作,当事务A第一读取是表内有10行数据,此时事务B插入(Insert)了一条,当事务A再次读取时发现变成了11行,造成幻觉;
丢失更新:事务A和事务B拿到同一份数据1,A在1的基础上加1变成2后,此时B也在1的基础上加2变成3,由于B提交晚,因此最终数据变成了3,覆盖了事务A的操作,称为丢失更新;
下面是从网络搜索到到一张关于隔离级别和锁关系的动态图(上传后居然不动了,对CSDN已经无力吐槽了-_-!):
http://static.oschina.net/uploads/img/201207/09074335_5YM8.gif
最后附上一些写的比较好的文章:
http://blog.itpub.net/13651903/viewspace-1091664/
http://www.cnblogs.com/wghao/archive/2010/01/17/1650120.html
http://www.cnblogs.com/chillsrc/archive/2013/04/13/3018386.html
http://www.cnblogs.com/xwdreamer/archive/2012/07/30/2615357.html
标签:
原文地址:http://blog.csdn.net/bjyfb/article/details/44022995