今天介绍下,在 MySQL
的 InnoDB
存储引擎中,事务隔离是如何实现的。
InnoDB
里面每个事务有一个唯一的事务 ID
,叫作 transaction id
。它是在事务开始的时候向 InnoDB
的事务系统申请的,是按申请顺序严格递增的。
对于数据库的每行记录,都会有三个隐藏字段:db_trx_id (事务 id)
、db_roll_pt (回滚指针)
、delete_flag(删除标记)
。— 有懂的朋友,还望别细纠,其实 delete_flag
是在头信息中,这里是为了方便理解
对于 DML
操作来说:
- INSERT:创建一条数据,
db_trx_id
的值为当前事务id
,db_roll_pt
为null
。 - UPDATE:复制一行数据,将当前复制后这一行的
db_trx_id
置为当前事务的id
,db_roll_pt
是一个指针,指向复制前的那一条的。 - DELETE:复制一行数据,将当前复制后这一行的
db_trx_id
置为当前事务的id
,db_roll_pt
是一个指针,指向复制前的那一条的。并把delete_flag
置为true
。
我们会用此语句建表及初始化数据,用于下面举例:
代码语言:javascript复制CREATE TABLE `t` (
`id` int(11) NOT NULL,
`k` varchar(32) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB;
insert into t(id, k) values(1, 1);
数据初始状态为:
Repeatable Read 可重复读
如当前的隔离界别为 Repeatable Read
,下面是 SQL 的执行过程:
那么对于第 8,10,12,13 行来说,查询的结果应该是什么呢?
结果应该分别是:2,1,3,1 。
下面我们来逐步回放,MySQL 底层是如何实现这整个过程的:
- 第 1 行:表示每个事务的 ID 号,其中
read view
取的是所有当前活跃的事务 ID 数组,活跃指的是,已开启并生成事务 ID 但未提交的事务。max id
取的是,目前为止,最大的事务 ID,不论是否已提交。我们还称read view
数组中,最小的值为min id
。 - 第 2 - 4 行:表示分别开启使用,并创建此事务的
read view
及max id
,要注意的是,这里我并没有使用begin/start transaction
来开启事务,是因为它们并不会马上创建read view
及max id
,而是在执行第一条select
语句后,来进行创建的。 - 第 5 行为修改 k 的值,自增 1,按照上面所说的规则,修改后:
- 第 6 行,提交 ID 为 102 的事务。
- 第 7 行执行了一个简单查询,未手动开启事务,但也会自动开启并生成
read view
及max id
,分别为read-view: [100, 101]
,max-id: 103
此时会根据查询规则,进行查找,规则如下:
- 如果数据的
db_trx_id < min id
,则说明数据在开启当前事务前已提交的,内容可见。 - 如果数据的
db_trx_id > max id
,则说明数据在此事务启动后生成的,内容不可见。 - 如果数据的
min id <= db_trx_id <= max id
,则还分为两种情况: 3.1 若db_trx_id
在read view
的数组中,表示这个版本是由还没提交的事务生成的,不可见,但如果是自己的事务,则可见。 3.2. 若不在数据中,则表示这个版本是已经提交了的事务生成的,可见。
示意图如下:
当前的事务的一致性视图为 read view: [100, 101]
,max id: 103
,那么根据这个规则,在上面的数据链中查询数据,从最新的蓝色,开始找,找到第一个数据的 db_trx_id
为 102,符合规则 3.2 属于可见范围,查询结果为 2。
- 第 8 行,当前的事务的一致性视图为
read view: [100, 101]
,max id: 101
同样根据规则,第一个数据的db_trx_id
为 102,符合规则 2,不可见,那么根据指针db_roll_pt
继续查找,找到db_trx_id
为 10 的数据,符合规则 1,数据可见,查询结果为 1。 - 第 9 行,修改 k 的值,自增 1,按照上面所说的规则,修改后:
- 第 10 行,当前的事务的一致性视图为
read view: [100]
,max id: 100
同样根据规则,第一个数据的db_trx_id
为 100,符合规则 3.1,在read view
数组中,但是此 id 为当前事务 id,所以可是可见的,查询结果为 3。 - 第 11 行,当前的事务的一致性视图为
read view: [100, 101]
,max id: 101
同样根据规则,第一个数据的db_trx_id
为 100,符合规则 3.1,在read view
中,但是此 id 不为当前事务 id,所以内容可见的,那么根据指针db_roll_pt
继续查找,找到db_trx_id
为 102 的数据,符合规则 2,不可见,继续根据指针db_roll_pt
查找,找到db_trx_id
为 10 的数据,符合规则 1,数据可见,查询结果为 1。 - 第 12 - 13 行,为提交事务语句。
Read Committed 读已提交
处于 Read Committed 读已提交
也可套用上面的规则,不过一致性视图: read view
和 max id
的创建时机,是每一条 select
语句时重新生成。你根据上面的内容,可以自己动手试验下读已提交。