引言
多版本并发控制(MVCC)是一种用于提高数据库并发性能的技术,尤其在处理高并发读写操作时极为有效。MVCC通过维护数据的多个版本来避免读写冲突,使得读操作无需阻塞写操作,写操作也不会影响读操作。下面,我们具体讲解MySQL中InnoDB存储引擎对MVCC的实现原理。
MVCC 的基本概念
MVCC(Multi-Version Concurrency Control)可以看作是行级锁的一种改进,主要通过保存数据在不同时间点的多个版本来实现数据的并发访问。MVCC 常用于实现乐观锁定策略,通过版本号控制数据的一致性,避免了因锁导致的性能瓶颈。
不知道大家是否想过这样一个问题:在日常操作中,为什么读写操作可以互不阻塞?
在MVCC技术出现之前,为了确保在特定隔离级别下,多个事务之间不发生数据异常,需要通过加锁来控制并发。
例如,当事务A正在读取一行数据时,其他事务不能对这行数据进行修改,因为这可能导致事务A读取到不一致的数据。
MVCC的核心优势就在于解决了读写操作之间的阻塞问题,从而显著提高了事务的并发性。接下来,我们通过一个例子来逐步学习MySQL中MVCC的实现。
我们来看图1中的这个例子;
- 在Session1中对某条记录进行了修改但尚未提交时,此时在Session2中执行查询,返回的记录会是什么呢?
- 而当Session1提交后,session2再次查询时结果又会如何变化呢?
要回答这个问题,关键在于事务的隔离级别,不同隔离级别下的行为如下:
- READ-UNCOMMITTED 隔离级别:在session 1提交前后,session 2查询到的都是修改后的结果,即
column= lisi
。 - READ-COMMITTED 隔离级别:在session 1提交前,session 2查询到的仍是原始数据
column= zhangsan
,但在提交后,查询结果变为column= lisi
。
- REPEATABLE-READ 和 SERIALIZABLE 隔离级别:在session 1提交前后,session 2查询到的始终是修改前的结果
column= zhangsan
。
以下是MySQL 5.7和MySQL 8.0中查询和修改数据库隔离级别语句的对比表格:
操作 | MySQL 5.7 | MySQL 8.0 |
---|---|---|
查询当前会话隔离级别 | SELECT @@tx_isolation; 或 SHOW VARIABLES LIKE 'transaction_isolation'; | SELECT @@transaction_isolation; 或 SHOW VARIABLES LIKE 'transaction_isolation'; |
查询全局隔离级别 | SELECT @@global.tx_isolation; 或 SHOW GLOBAL VARIABLES LIKE 'transaction_isolation'; | SELECT @@global.transaction_isolation; 或 SHOW GLOBAL VARIABLES LIKE 'transaction_isolation'; |
修改当前会话隔离级别 | SET SESSION TRANSACTION ISOLATION LEVEL 隔离级别; | SET SESSION TRANSACTION ISOLATION LEVEL 隔离级别; |
修改全局隔离级别 | SET GLOBAL TRANSACTION ISOLATION LEVEL 隔离级别; | SET GLOBAL TRANSACTION ISOLATION LEVEL 隔离级别; |
其中,隔离级别可以是以下几种之一:
READ UNCOMMITTED
READ COMMITTED
REPEATABLE READ
(MySQL默认)SERIALIZABLE
在这里我们暂且不讨论数据库的ACID特性,而是关注一个问题:在数据被修改后,数据库是如何确保查询结果仍然保持为之前的值?
这正是通过数据库中的Undo日志和MVCC技术来实现的,如图1-1所示。
InnoDB 中的 MVCC 主要依赖于以下三个隐藏列,这些列在每行记录中维护,以实现多版本并发控制:
- DB_TRX_ID
每条记录都包含一个
DB_TRX_ID
,即事务ID,记录了最后一次对该行进行插入或更新的事务ID。当需要判断某个事务中某条记录是否可见时,InnoDB 会根据该列与当前事务的视图进行对比。 - DB_ROLL_PTR
DB_ROLL_PTR
是一个回滚指针,指向该行记录的上一个版本。在数据更新时,InnoDB 会保留旧版本的记录,并通过这个指针将其链接起来,从而支持通过回滚找到之前的数据版本。这是实现 MVCC 中多版本存储的关键。 - DB_ROW_ID
DB_ROW_ID
是一个自增的行ID,在没有显式主键的情况下,用来唯一标识每一行数据。尽管DB_ROW_ID
在 MVCC 机制中并不直接控制并发,但它对行记录的管理和定位起着重要作用,尤其是在没有定义主键时。
这三个隐藏列共同支撑了 InnoDB 的 MVCC 实现,确保在高并发场景下,读写操作能够并行进行而不互相阻塞。
当插入一条数据时, 在记录上对应的回滚段指针为NULL, 如图1-2所示
在更新记录时,原始记录会被保存到 Undo 表空间中,查询时未提交的修改数据可以通过读取 Undo 表空间中的旧版本来实现。多个数据版本通过链表结构链接,形成一个版本链。MySQL 通过记录中的回滚指针(DB_ROLL_PTR
)和事务ID(DB_TRX_ID
)来判断数据版本的可见性。具体判断流程如下:
判断流程
在每个事务开始时,系统会将当前所有活跃事务的信息拷贝到一个列表中,称为Read View。读取记录时,会根据记录的 TRX_ID
与 Read View 中的最大 TRX_ID
和最小 TRX_ID
进行比较,判断该记录是否对当前事务可见。
- 如果记录的
TRX_ID
小于 Read View 中的最小TRX_ID
******:** 说明该记录在 Read View 中的所有事务开始之前就已提交,因而对当前事务可见,可以直接返回数据。 - 如果记录的
TRX_ID
大于 Read View 中的最大TRX_ID
******:** 说明该记录在事务启动后被修改。此时需要根据回滚指针找到前一个版本的记录,并将其TRX_ID
赋值给当前行,再重新进行判断。 - 如果记录的
TRX_ID
位于 Read View 的范围内:
需要进一步判断:
- 如果
TRX_ID
在 Read View 中存在:- 这意味着该记录在事务启动时是活跃的,未提交。此时根据回滚指针找到前一个版本的记录,取出其
TRX_ID
进行下一轮判断。
- 这意味着该记录在事务启动时是活跃的,未提交。此时根据回滚指针找到前一个版本的记录,取出其
- 如果
TRX_ID
不在 Read View 中:- 说明该记录在事务启动时已提交,因此对当前事务可见,可以直接返回数据。
什么是 Read View
Read View 是 MySQL InnoDB 引擎用于实现 多版本并发控制 (MVCC) 的关键机制。它在事务执行快照读时生成,确保事务能够看到一致的、稳定的数据视图。Read View 记录了事务生成快照时的系统状态,尤其是所有活跃事务的 ID 列表。通过 Read View,数据库可以确保事务只看到在其生成视图时已经提交的数据,而不受之后其他事务的影响。
当前读和快照读
当前读 (Current Read)
- 当前读需要获取记录的最新版本,并且在读操作期间可能会加锁,以防止其他事务同时修改这些记录。
- 场景:
SELECT ... LOCK IN SHARE MODE
,SELECT ... FOR UPDATE
,UPDATE
,INSERT
,DELETE
等。 - 这些操作确保事务读取到的数据是最新的,并且避免其他事务在操作期间对数据进行并发修改。
快照读 (Snapshot Read)
- 快照读通常指的是不加锁的
SELECT
操作,它通过Read View
实现,确保事务读取到的总是快照生成时的数据版本,而不是之后的修改。 - 场景:
SELECT
操作,在隔离级别为读已提交 (Read Committed) 或可重复读 (Repeatable Read) 时尤其常见。 - 在隔离级别为串行化 (Serializable) 时,快照读会退化为当前读,因为此时所有操作都必须确保数据的完全一致性,避免幻读现象。
Read View 的四个字段
Read View 的四个字段决定了事务在执行快照读时哪些数据对其可见,哪些不可见。
trx_ids:
- trx_ids 是生成 Read View 时所有 活跃事务(即未提交事务)的 ID 列表。
- 这些事务的更改对当前事务不可见。换句话说,Read View 生成后,这些事务对数据库的修改数据将不被该事务看到。
low_limit_id:
- low_limit_id 是下一个将分配的事务 ID。
- 由于事务 ID 是递增的,因此 low_limit_id 标志着比该 ID 更新的事务(即后续事务)的数据对当前 Read View 不可见。
up_limit_id:
- up_limit_id 是生成 Read View 时已经提交的最小事务 ID。
- 这个 ID 之前提交的所有事务产生的数据变更对当前事务可见,这也是判断数据版本可见性的边界之一。
creator_trx_id:
- creator_trx_id 是创建 Read View 的事务 ID。
- 这个字段用于在当前事务内判断自己提交的数据版本的可见性。例如,如果在事务中执行了多次快照读,creator_trx_id 帮助确定哪些数据版本是当前事务自己生成的,并对其可见。
Read View
通过以上四个字段来管理事务快照的可见性,保证了事务在快照读时的一致性。在 MySQL 的 MVCC 实现中,这一机制非常重要,因为它确保了在高并发环境下事务隔离的实现,防止脏读、不可重复读和幻读问题的发生。
源码解读
在 MySQL 8.0 的源码中,Read View
的核心代码主要涉及 InnoDB 存储引擎的事务管理部分。它们定义了 Read View
的生成、字段初始化和可见性判断等功能。
read_view_open_now
函数
read_view_open_now 函数是用来创建一个新的 Read View。它会记录当前活跃事务,并初始化 Read View 的各个字段。
代码语言:javascript复制read_view_t* read_view_open_now(trx_t* trx) {
read_view_t* view;
view = static_cast<read_view_t*>(ut_malloc_nokey(sizeof(*view)));
ut_a(view != NULL);
/* 设置创建者事务 ID */
view->creator_trx_id = trx->id;
/* 获取当前活跃事务列表并赋值给 view */
view->m_trx_ids = trx_sys_get_active_trx_ids();
/* 活跃事务的数量 */
view->trx_list_len = trx_sys->rw_trx_list_len;
/* 设置低水位 */
view->low_limit_no = trx_sys->rw_trx_list->start->id;
/* 设置高水位 */
view->up_limit_no = trx_sys->rw_trx_list->end->id;
return(view);
}
trx_sys_get_active_trx_ids
函数
trx_sys_get_active_trx_ids 函数用于获取当前系统中所有活跃事务的 ID。这个函数返回一个包含所有未提交事务 ID 的列表,这些事务的变更对当前 Read View 不可见。
代码语言:javascript复制trx_id_t* trx_sys_get_active_trx_ids() {
trx_id_t* trx_ids;
/* 分配用于存储事务 ID 的内存空间 */
trx_ids = static_cast<trx_id_t*>(ut_malloc_nokey(trx_sys->rw_trx_list_len * sizeof(trx_id_t)));
/* 遍历当前活跃事务列表,存储每个事务的 ID */
rw_trx_list_lock();
rw_trx_t* rw_trx = trx_sys->rw_trx_list->start;
for (size_t i = 0; i < trx_sys->rw_trx_list_len; i , rw_trx = rw_trx->next) {
trx_ids[i] = rw_trx->id;
}
rw_trx_list_unlock();
return trx_ids;
}
read_view_sees_trx_id
函数
read_view_sees_trx_id 函数用于判断某个事务 ID 的变更是否对当前 Read View 可见。它依据 Read View 的四个字段来决定可见性。
代码语言:javascript复制bool read_view_sees_trx_id(read_view_t* view, trx_id_t trx_id) {
/* 如果事务 ID 小于 up_limit_id,说明该事务在 Read View 生成之前已经提交,因此可见 */
if (trx_id < view->up_limit_no) {
return true;
}
/* 如果事务 ID 大于或等于 low_limit_id,说明该事务在 Read View 生成之后启动,因此不可见 */
if (trx_id >= view->low_limit_no) {
return false;
}
/* 如果事务 ID 在 active_trx_ids 列表中,说明它是活跃事务之一,因此不可见 */
for (size_t i = 0; i < view->trx_list_len; i ) {
if (view->m_trx_ids[i] == trx_id) {
return false;
}
}
/* 如果上述条件都不满足,则该事务可见 */
return true;
}
read_view_close
函数
read_view_close 函数用于关闭并销毁一个 Read View,释放内存。
代码语言:javascript复制void read_view_close(read_view_t* view) {
ut_free(view->m_trx_ids);
ut_free(view);
}
代码逻辑总结
创建 Read View
(read_view_open_now
):
- 为事务生成一个新的 Read View,并初始化其所有字段,包括活跃事务列表、上下限 ID 等。
获取活跃事务 ID (trx_sys_get_active_trx_ids
):
- 遍历系统中所有未提交的事务,获取它们的 ID,并将这些 ID 存储在 Read View 中。
判断事务可见性 (read_view_sees_trx_id
):
- 判断某个事务 ID 是否对当前 Read View 可见。依据生成 Read View 时的系统状态(如事务 ID 上下限、活跃事务列表等)进行判断。
关闭 Read View
(read_view_close
):
- 释放 Read View 相关的内存,结束 Read View 的生命周期。
这些核心代码段展示了 InnoDB 是如何通过 Read View
实现快照读,确保事务隔离和一致性。
MVCC相关实现
准备测试数据
在 Navicat 中执行以下 SQL,准备一张简单的测试表:
代码语言:javascript复制CREATE TABLE test_mvcc (
id INT PRIMARY KEY,
value VARCHAR(50)
) ENGINE=InnoDB;
INSERT INTO test_mvcc (id, value) VALUES (1, 'Initial Value');
在两个会话中进行操作
在 Navicat 中打开两个查询窗口,模拟两个事务会话。
会话 1(启动事务并更新记录):
代码语言:javascript复制START TRANSACTION;
UPDATE test_mvcc SET value = 'Updated Value by Session 1' WHERE id = 1;
-- 此时事务未提交,数据仅对会话 1 可见
会话 2(启动事务并查询记录):
代码语言:javascript复制START TRANSACTION;
SELECT * FROM test_mvcc WHERE id = 1;
-- 此时会话 2 应该仍然看到 'Initial Value',因为会话 1 的事务未提交
在会话 1 提交事务之前,数据对其他事务不可见。
提交事务并观察变化
会话 1 提交事务:
代码语言:javascript复制COMMIT;
会话 2 再次查询:
代码语言:javascript复制SELECT * FROM test_mvcc WHERE id = 1;
-- 现在会话 2 可以看到更新后的值 'Updated Value by Session 1'
分析可见性
可以通过这个实验观察事务之间的隔离性和记录的可见性,结合以下 MySQL 内置命令来查看更多细节:
代码语言:javascript复制-- 查看 InnoDB 的事务状态
SHOW ENGINE INNODB STATUS;
-- 查看当前事务的 ID 和隔离级别
SELECT @@TRANSACTION_ISOLATION, @@tx_isolation;
Navicat 可以帮助在图形界面中直观地管理和操作多个会话,但代码级别的调试,如跟踪 MySQL 源代码中具体的可见性判断过程,需要使用 GDB 等工具。
这里需要说明一点, 对于不同的事务隔离级别, 可见性的实现也不一样。
- 对于READ-COMMITTED隔离级别, 事务内的每一条查询语句都会重新创建ReadView, 这样就会产生不可重复读现象。
- 对于REPEATABLE-READ隔离级别, 事务内第一条语句执行时会创建ReadView, 在事务结束这段时间内每一次查询都不会重新创建ReadView, 从而实现了可重复读。
参考资料: https://dev.mysql.com/blog-archive/mysql-8-0-mvcc-of-large-objects-in-innodb/