刚开始写博客.. 写的太low。
1、数据库的两种读,每种读读的数据版本不一样,所以也称为MVCC,即多版本并发控制
a) 快照读
select * from where xxx 这种形式的都是快照读。
b) 当前读
update , insert ,delete ,select xx from xx for update , in share mode 都是当前读
当前读会等待,不会返回数据的历史版本
2、mvcc 的实现原理
mvcc是基于read view、活跃事务列表 做的,以后的文章我会专门分析这块。
3、mysql 是如何解决脏读、幻读、不可重复读的
a) 在快照读下是用的mvcc 做的 ,mysql RR 下 会产生幻读!!
快照读下数据的可见返回 = mvcc + 当前事务加锁的行
b) 在当前读使用 锁
加上锁了,别的事务要修改只能等待,自然也就没有各种问题了
总结:innodb默认使用的mvcc + 锁的混合模式。innodb的RR模式并没有完全解决幻读的问题。
mvcc 和 锁 都可以解决幻读、重复读问题。两者方式不一样,前者通过冗余数据,后者通过锁。
一 数据库事务的隔离级别
数据库事务的隔离级别有4个,由低到高依次为Read uncommitted 、Read committed 、Repeatable read 、Serializable ,这四个级别可以逐个解决脏读 、不可重复读 、幻读这几类问题。
1. Read UnCommitted(读未提交)
最低的隔离级别。一个事务可以读取另一个事务并未提交的更新结果。
2. Read Committed(读提交)
大部分数据库采用的默认隔离级别。一个事务的更新操作结果只有在该事务提交之后,另一个事务才可以的读取到同一笔数据更新后的结果。
3. Repeatable Read(重复读)
mysql的默认级别。整个事务过程中,对同一笔数据的读取结果是相同的,不管其他事务是否在对共享数据进行更新,也不管更新提交与否。
4. Serializable(序列化)
最高隔离级别。所有事务操作依次顺序执行。注意这会导致并发度下降,性能最差。通常会用其他并发级别加上相应的并发锁机制来取代它。
二 不同事务级别带来的并发问题
1 脏读
脏读发生在一个事务A读取了被另一个事务B修改,但是还未提交的数据。假如B回退,则事务A读取的是无效的数据。这跟不可重复读类似,但是第二个事务不需要执行提交。
2 不可重复读
在基于锁的并行控制方法中,如果在执行select时不添加读锁,就会发生不可重复读问题。
在多版本并行控制机制中,当一个遇到提交冲突的事务需要回退但却被释放时,会发生不可重复读问题。
在上面这个例子中,事务2提交成功,它所做的修改已经可见。然而,事务1已经读取了一个其它的值。在序列化和可重复读的隔离级别中,数据库管理系统会返回旧值,即在被事务2修改之前的值。在提交读和未提交读隔离级别下,可能会返回被更新的值,这就是“不可重复读”。
有两个策略可以防止这个问题的发生:
(1) 推迟事务2的执行,直至事务1提交或者回退。这种策略在使用锁时应用。
(2) 而在多版本并行控制中,事务2可以被先提交。而事务1,继续执行在旧版本的数据上。当事务1终于尝试提交时,数据库会检验它的结果是否和事务1、事务2顺序执行时一样。如果是,则事务1提交成功。如果不是,事务1会被回退。
3 幻读
幻读发生在当两个完全相同的查询执行时,第二次查询所返回的结果集跟第一个查询不相同。
发生的情况:没有范围锁。
三 例子比较不可重复读和幻读
1 不可重复读
不可重复读的重点是修改: 同样的条件, 你读取过的数据, 再次读取出来发现值不一样了
例子:
在事务1中,Mary 读取了自己的工资为1000,操作并没有完成
con1 = getConnection();
select salary from employee empId ="Mary";
在事务2中,这时财务人员修改了Mary的工资为2000,并提交了事务.
con2 = getConnection();
update employee set salary = 2000;
con2.commit();
在事务1中,Mary 再次读取自己的工资时,工资变为了2000
select salary from employee empId ="Mary";
在一个事务中前后两次读取的结果并不致,导致了不可重复读。
2 幻读
幻读的重点在于新增或者删除 (数据条数变化)。同样的条件, 第1次和第2次读出来的记录数不一样
例子:
目前工资为1000的员工有10人。
事务1,读取所有工资为1000的员工。
con1 = getConnection();
Select * from employee where salary =1000;
共读取10条记录
这时另一个事务向employee表插入了一条员工记录,工资也为1000
con2 = getConnection();
Insert into employee(empId,salary) values("Lili",1000);
con2.commit();
事务1再次读取所有工资为1000的员工
select * from employee where salary =1000;
共读取到了11条记录,这就像产生了幻读。
一、缘由
众所周知MySQL从5.5.8开始,Innodb就是默认的存储引擎,Innodb最大的特点是:支持事务、支持行级锁。
既然支持事务,那么就会有处理并发事务带来的问题:更新丢失、脏读、不可重复读、幻读;相应的为了解决这四个问题,
就产生了事务隔离级别:未提交读(Read uncommitted),已提交读(Read committed),可重复读(Repeatable read),可序列化(Serializable)。
之前在看事务隔离级别的时候,基本是一知半解。再次碰到,还是浆糊,所以这里打算彻底搞明白、清楚,也好后续的学习。
二、解决办法:
1、概念说明:
更新丢失:最后的更新覆盖了其他事务之前的更新,而事务之间并不知道,发生更新丢失。更新丢失,可以完全避免,应用对访问的数据加锁即可。
脏读:(针对未提交的数据)一个事务在更新一条记录,未提交前,第二个事务读到了第一个事务更新后的记录,那么第二个事务就读到了脏数据,会产生对第一个未提交
数据的依赖。一旦第一个事务回滚,那么第二个事务读到的数据,将是错误的脏数据。
不可重复读:(读取数据本身的对比)一个事务在读取某些数据后的一段时间后,再次读取这个数据,发现其读取出来的数据内容已经发生了改变,就是不可重复读。
幻读:(读取结果集条数的对比)一个事务按相同的查询条件查询之前检索过的数据,确发现检索出来的结果集条数变多或者减少(由其他事务插入、删除的),类似产生幻觉。
2、不可重复读和幻读的区别:
不可重复读
重点是修改:同样的条件下,你读取过的数据,再次读取发现值不一样了。
例子:(只是为了说明区别,没有事务隔离级别约束)
事务1:Jack读取自己的工资为1000,事务并没有结束:
select salary from employee empId ="Jack";
事务2:财务人员修改了Jack的工资为2000,并提交事务(事务1不知道):
update employee set salary = 2000;
commit;
在事务1中,再次读取Jack的工资时,工资变为2000
select salary from employee empId ="Jack";
在一个事务中前后两次读取的结果值并不一致,导致了不可重读读
幻读
重点在于新增或者删除(数据条数的变化):同样条件下,第一次和第二次读出来的记录条数不一样。
例子:
目前工资为1000的员工有10人。
事务1:读取所有工资为1000的员工,事务进行中
select count(*) from employee where salary = 1000;
共读取到10条记录。
事务2:同时插入一条新的员工记录,工资也为1000
insert into employee(empId, salary) values(‘Tom‘, 1000);
commit;
事务1:再次读取所有工资为1000的员工
select count(*) from employee where salary = 1000;
共读取到了11条记录,这样就像产生了幻读。
三、事务隔离级别:
并发处理带来的问题中,更新丢失可以完全避免,由应用对数据加锁即可。脏读、不可重读度、幻读,其实都是数据库的一致性问题,必须由一定的事务隔离机制来解决。
其中一种方法是:不用加锁,通过一定的机制生成一个数据请求时间点的一致性快照,并用这个快照来提供一个界别的一致性读取。从用户的角度看,好像是数据库提偶拱了
统一数据的多个版本。这种技术叫做:数据库多版本并发控制,MVCC 多版本数据库。
事务隔离的本质是使事务在一定程度上串行化执行,显然和并发机制是矛盾的。数据库的事务隔离越严格,并发负作用越小,代价越高(影响并发访问了呗)。
为了解决隔离和并大的矛盾,IOS SQL92规定了4个隔离级别。(隔离==串行)
MySQL 默认的级别是:Repeatable read 可重复读。