写点什么

一文详解 MySQL 事务底层原理,全是干货,推荐收藏

作者:一灯架构
  • 2022-10-21
    北京
  • 本文字数:1802 字

    阅读完需:约 1 分钟

迎面走来了你的面试官,身穿格子衫,挺着啤酒肚,发际线严重后移的中年男子。手拿泡着枸杞的保温杯,胳膊夹着 MacBook,MacBook 上还贴着公司标语:“我爱加班”。



面试开始,直入正题。

面试官: 看你简历上面写着精通 MySQL,我先问你事务的特性是什么?

老生常谈,这个还有谁不会背的吗?

我: 这个我知道,事务有四大特性,分别是原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability),简称 ACID。

原子性是指事务中所有操作要么全部成功,要么全部失败。

一致性是指事务执行前后,数据始终处于一致性状态,不会出现数据丢失。

隔离性是指事务提交前的中间状态对其他事务不可见,即相互隔离。

持久性是指事务提交后,数据的修改永久保存在数据库中。

面试官: 嗯,回答得不错。那你知道 MySQL 底层是怎么实现事务的四大特性?

这道题有点深了,需要背会 redo log、undo log、mvcc。

千万别说不知道这几个东西是干嘛用的。

不但要知道,还要跟事务扯上关系。

我: 原子性是 undo log 实现的,一致性是由代码逻辑层面保证的,隔离性是由 mvcc 实现的,持久性是基于 redo log 实现的。

Redo Log(重做日志):

Redo Log 记录的是物理日志,也就是磁盘数据的修改。用来保证服务崩溃后,仍能把事务中变更的数据持久化到磁盘上。

如果没有 Redo Log 的话,会发生什么?

修改数据的过程就变成这样了:

  1. 从磁盘加载数据到内存

  2. 在内存中修改数据

  3. 把新数据持久化到磁盘



这样做,会有严重的性能问题。

  1. InnoDB 在磁盘中存储的基本单元是页,可能本次修改只变更一页中几个字节,但是需要刷新整页的数据,就很浪费资源。

  2. 一个事务可能修改了多页中的数据,页之间又是不连续的,就会产生随机 IO,性能更差。

所以为了提高写入性能,于是就引入了 Redo Log。

看一下引入 Redo Log 后修改流程:

  1. 从磁盘加载数据到内存

  2. 在内存中修改数据

  3. 把新数据写到 Redo Log Buffer

  4. Redo Log Buffer 中数据持久化到 Redo Log 文件中

  5. Redo Log 文件中数据持久化到数据库磁盘中



Undo Log(回滚日志):

Undo Log 记录的是逻辑日志,用来回滚事务时,恢复到修改前的数据。

比如:当我们执行一条 insert 语句时,Undo Log 就记录一条相反的 delete 语句。

加入 Undo Log 之后的修改流程就是这样的:



MVCC(多版本并发控制,Multi-Version Concurrency Control):

记录的是某个时间点上的数据快照,用来实现不同事务之间数据的隔离性。

提到隔离性,一定要说一下事务的隔离级别。

说事务隔离级别之前,必须要先说一下并发事务产生的问题:

脏读: 一个事务读到其他事务未提交的数据。

不可重复读: 多次读取相同的数据,得到的结果集不一致,即读到其他事务提交后的数据。

幻读: 相同的查询条件,多次读取的结果不一致,即读到其他事务提交后的数据。

不可重复读与幻读的区别是: 不可重复读是读到了其他事务执行 update、delete 后的数据,而幻读是读到其他事务执行 insert 后的数据。

隔离级别

Read UnCommitted(读未提交): 读到其他事务未提交的数据,会出现脏读、不可重复读、幻读。

Read Committed(读已提交): 读到其他事务已提交的数据,解决了脏读,会出现不可重复读、幻读。

Repeatable Read(可重复读): 相同的数据,多次读取到的结果集一致。解决了不可重复读,还是会出现幻读。

Serializable(串行化): 所有事务串行执行,解决了幻读。

再谈 MVCC:

MVCC 解决了读写冲突,实现了读写并行,提升了事务的性能。

由于 Read UnCommitted 隔离级别下,每次都读取最新的数据。而 Serializable 隔离级别下,对所有读取数据都加锁。这两种隔离级不需要 MVCC,所以 MVCC 只在 Read Committed 和 Repeatable Read 两种隔离级别下起作用。

MVCC 的实现方式通过两个隐藏列 trx_id(最近一次提交事务的 ID)和 roll_pointer(上个版本的地址),建立一个版本链。并在事务中读取的时候生成一个 ReadView(读视图),在 Read Committed 隔离级别下,每次读取都会生成一个读视图,而在 Repeatable Read 隔离级别下,只会在第一次读取时生成一个读视图。



InnoDB 如何解决幻读的?

先普及一下快照读和当前读。

当前读: 读取数据的最新版本,并对数据进行加锁。

例如:insert、update、delete、select for update

快照读: 读取数据的历史版本,不对数据加锁。

例如:select

在当前读的情况下,是通过加锁来解决幻读。

在快照读的情况下,是通过 MVCC 来解决幻读。

面试官: 还得是你,就你总结的全。今天的面试先到这吧,下一面要问你 MySQL 的锁,你准备一下。

本文知识点总结:



用户头像

一灯架构

关注

公众号:「一灯架构」 2020-11-20 加入

公众号:「一灯架构」,开发专家,只分享有趣的技术干货。

评论

发布
暂无评论
一文详解MySQL事务底层原理,全是干货,推荐收藏_Java_一灯架构_InfoQ写作社区