1.ACID
在关系型数据库管理系统中,一个逻辑工作单元要成为事务,必须满足这4个特性,即所谓的ACID:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性(Durability)。
1.1原子性
原子性:事务是一个原子操作单元,其对数据的修改,要么全都执行,要么全都不执行。修改---BufferPool修改---刷盘。可能会有下面两种情况:
事务提交了,如果此时BufferPool的脏页没有刷盘,如何保证修改的数据生效?Redo
如果事务没提交,但是BufferPool的脏页刷盘了,如何保证不该存在的数据撤销?Undo
每一个写事务,都会修改BufferPool,从而产生相应的Redo/Undo日志,在BufferPool中的页被刷到磁盘之前,这些日志信息都会先写入到日志文件中,如果BufferPool中的脏页没有刷成功,此时数据库挂了,那在数据库再次启动之后,可以通过Redo日志将其恢复出来,以保证脏页写的数据不会丢失。如果脏页刷新成功,此时数据库挂了,就需要通过Undo来实现了。
1.2持久性
持久性:指的是一个事务一旦提交,它对数据库中数据的改变就应该是永久性的,后续的操作或故障不应该对其有任何影响,不会丢失。如下图所示,一个“提交”动作触发的操作有:binlog落地、发送binlog、存储引擎提交、flush_logs,check_point、事务提交标记等。这些都是数据库保证其数据完整性、持久性的手段。
MySQL的持久性也与WAL技术相关,redolog在系统Crash重启之类的情况时,可以修复数据,从而保障事务的持久性。通过原子性可以保证逻辑上的持久性,通过存储引擎的数据刷盘可以保证物理上的持久性。
1.3隔离性
隔离性:指的是一个事务的执行不能被其他事务干扰,即一个事务内部的操作及使用的数据对其他的并发事务是隔离的。InnoDB支持的隔离性有4种,隔离性从低到高分别为:读未提交、读提交、可重复读、可串行化。锁和多版本控制(MVCC)技术就是用于保障隔离性的。
1.4一致性
一致性:指的是事务开始之前和事务结束之后,数据库的完整性限制未被破坏。一致性包括两方面的内容,分别是约束一致性和数据一致性。
约束一致性:创建表结构时所指定的外键、Check、唯一索引等约束,可惜在MySQL中不支持Check。
数据一致性:是一个综合性的规定,因为它是由原子性、持久性、隔离性共同保证的结果,而不是单单依赖于某一种技术。
一致性也可以理解为数据的完整性。数据的完整性是通过原子性、隔离性、持久性来保证的,而这3个特性又是通过Redo/Undo来保证的。逻辑上的一致性,包括唯一索引、外键约束、check约束,这属于业务逻辑范畴。
ACID及它们之间的关系如下图所示,4个特性中有3个与WAL有关系,都需要通过Redo、Undo日志来保证等。WAL的全称为Write-AheadLogging,先写日志,再写磁盘。
2.事务控制
2.1并发事务
事务并发处理可能会带来一些问题,比如:更新丢失、脏读、不可重复读、幻读等。
更新丢失
当两个或多个事务更新同一行记录,会产生更新丢失现象。可以分为回滚覆盖和提交覆盖。
回滚覆盖:一个事务回滚操作,把其他事务已提交的数据给覆盖了。
提交覆盖:一个事务提交操作,把其他事务已提交的数据给覆盖了。
脏读一个事务读取到了另一个事务修改但未提交的数据。
不可重复读一个事务中多次读取同一行记录不一致,后面读取的跟前面读取的不一致。
幻读一个事务中多次按相同条件查询,结果不一致。后续查询的结果和面前查询结果不同,多了或少了几行记录。
2.2排队
最简单的方法,就是完全顺序执行所有事务的数据库操作,不需要加锁,简单的说就是全局排队。序列化执行所有的事务单元,数据库某个时刻只处理一个事务操作,特点是强一致性,处理性能低。
2.3排他锁
引入锁之后就可以支持并发处理事务,如果事务之间涉及到相同的数据项时,会使用排他锁,或叫互斥锁,先进入的事务独占数据项以后,其他事务被阻塞,等待前面的事务释放锁。
在整个事务1结束之前,锁是不会被释放的,所以,事务2必须等到事务1结束之后开始。
2.4读写锁
读和写操作:读读、写写、读写、写读。读写锁就是进一步细化锁的颗粒度,区分读操作和写操作,让读和读之间不加锁,这样下面的两个事务就可以同时被执行了。
读写锁,可以让读和读并行,而读和写、写和读、写和写这几种之间还是要加排他锁。
2.5MVCC
多版本控制MVCC,也就是CopyonWrite的思想。MVCC除了支持读和读并行,还支持读和写、写和读的并行,但为了保证一致性,写和写是无法并行的。
在事务1开始写操作的时候会copy一个记录的副本,其他事务读操作会读取这个记录副本,因此不会影响其他事务对此记录的读取,实现写和读并行。
2.5.1MVCC概念
MVCC(MultiVersionConcurrencyControl)被称为多版本控制,是指在数据库中为了实现高并发的数据访问,对数据进行多版本处理,并通过事务的可见性来保证事务能看到自己应该看到的数据本。多版本控制很巧妙地将稀缺资源的独占互斥转换为并发,大大提高了数据库的吞吐量及读写性能。如何生成多版本?每次事务修改操作之前,都会在Undo日志中记录修改之前的数据状态和事务号,该备份记录可以用于其他事务的读取,也可以进行必要时的数据回滚。
2.5.2MVCC实现原理
MVCC最大的好处是读不加锁,读写不冲突。在读多写少的系统应用中,读写不冲突是非常重要的,极大的提升系统的并发性能,这也是为什么现阶段几乎所有的关系型数据库都支持MVCC的原因,不过目前MVCC只在ReadCommited和RepeatableRead两种隔离级别下工作。在MVCC并发控制中,读操作可以分为两类:快照读(SnapshotRead)与当前读(CurrentRead)。
快照读:读取的是记录的快照版本(有可能是历史版本),不用加锁。(select)
当前读:读取的是记录的最新版本,并且当前读返回的记录,都会加锁,保证其他事务不会再并发修改这条记录。(select...forupdate或lockinsharemode,insert/delete/update)为了让大家更直观地理解MVCC的实现原理,举一个记录更新的案例来讲解MVCC中多版本的实现。假设F1~F6是表中字段的名字,1~6是其对应的数据。后面三个隐含字段分别对应该行的隐含ID、事务号和回滚指针,如下图所示。
具体的更新过程如下:假如一条数据是刚INSERT的,DB_ROW_ID为1,其他两个字段为空。当事务1更改该行的数据值时,会进行如下操作,如下图所示。
用排他锁锁定该行;记录Redolog;
把该行修改前的值复制到Undolog,即图中下面的行;
修改当前行的值,填写事务编号,使回滚指针指向Undolog中修改前的行。
接下来事务2操作,过程与事务1相同,此时Undolog中会有两行记录,并且通过回滚指针连在一起,通过当前记录的回滚指针回溯到该行创建时的初始内容,如下图所示。
MVCC已经实现了读读、读写、写读并发处理,如果想进一步解决写写冲突,可以采用下面两种方案:
乐观锁
悲观锁
3.事务隔离级别
3.1隔离级别类型
前面提到的“更新丢失”、”脏读”、“不可重复读”和“幻读”等并发事务问题,其实都是数据库一致性问题,为了解决这些问题,MySQL数据库是通过事务隔离级别来解决的,数据库系统提供了以下4种事务隔离级别供用户选择。
读未提交ReadUn