面试官:你说说一条更新 SQL 的执行过程?
在上一篇《面试官:你说说一条查询SQL的执行过程?》中描述了 Mysql 的架构分层,通过解析器、优化器和执行引擎完成一条 SQL 查询的过程,那这一篇续上继续说明一条更新 SQL 的执行过程。
对于一个 SQL 语句的更新来说,前面的流程都可以说类似的,通过解析器进行语法分析,优化器优化,执行引擎去执行,这个都没有什么问题,重点在于多了一点东西,那就是redo_log
、undo_log
和binlog
。
执行流程大致如下:
首先客户端发送请求到服务端,建立连接。
服务端先看下查询缓存,对于更新某张表的 SQL,该表的所有查询缓存都失效。
接着来到解析器,进行语法分析,一些系统关键字校验,校验语法是否合规。
然后优化器进行 SQL 优化,比如怎么选择索引之类,然后生成执行计划。
执行引擎去存储引擎查询需要更新的数据。
存储引擎判断当前缓冲池中是否存在需要更新的数据,存在就直接返回,否则去从磁盘加载数据。
执行引擎调用存储引擎 API 去更新数据。
存储引擎更新数据,同时写入 undo_log、redo_log 信息。
执行引擎写 binlog,提交事务,流程结束。
可以看到相比于查询流程,实际上更新多了关于 undo_log 和 redo_log 的流程,接下来再具体探讨一下这几个流程的执行过程是什么样子。
redo_log
redo_log
按照字面翻译称为重做日志,是 InnoDB 存储引擎特有的,用于保证事务的原子性和持久性。怎么理解呢?简单来说就是保存我们执行的更新语句的记录,如果服务器或者 Mysql 宕机,通过 redo_log 可以恢复更新的数据。
按照上述流程来举例的话,比如update user set age=20 where id=1
这样的简单更新 SQL,我们不管执行引擎怎么拿到的数据,不管是从缓冲池拿的还是磁盘拿到的,这条现在数据都在缓冲池里面,然后去缓冲池的数据把age
改成 10。
缓冲池内存中的数据已经更新好了,那么接下来就该开始写 redo_log 了,只是 redo_log 也不是直接写文件的,一般都是这样对吧,直接写的话性能太差了,所以就有 redo_log_buffer 叫做 redo_log 缓冲。
在写 redo_log 的时候先把数据写到 redo_log 缓冲区,然后异步写入磁盘,很显然,极端情况下会有丢失数据的可能。
控制这个刷盘策略的的参数叫做innodb_flush_log_at_trx_commit
。
这个参数有 3 个值:0|1|2,默认的话是 1。
0 代表提交事务时不会写入磁盘,这样的话性能当然最好,但是在 Mysql 宕机的情况会丢失上一秒的事务的数据。
1 代表提交事务一定会进行一次刷盘,同步当然性能最差,但是也最安全。
2 代表写入文件系统的缓存,不进行刷盘。这个选项性能略差于 1,Mysql 宕机的话对数据没有任何影响,只有在操作系统宕机才会丢失数据,这种情况下默认 Mysql 每秒会执行一次刷盘。
使用 0 或者 2 虽然提高了性能,但是变相的也丧失了事务的持久性。
undo_log
重做日志保证了事务的持久性,保证能够在宕机后恢复事务的数据,那么另外一种情况就是事务在需要回滚的时候怎么办?这时候就是 undo_log 的作用了,它保证了事务的一致性。
对于 undo_log 来说,简单理解就是做了逆向操作。
比如insert
一条数据,就对应生成delete
,update
语句则生成相反的更新语句,这样做到将数据修改回之前的状态。
binlog
binlog 称为二进制日志,大家都很熟悉,记录了改变数据库的那些 SQL 语句,对于这里来说,更新语句当然是了。
通过不同于redo_log
是独属于存储引擎独有的东西,binlog
则是 Mysql 本身产生的日志。
不同于 redo_log 是物理日志,binlog 和 undo_log 都属于逻辑日志。
这有什么区别呢?
简单来说,逻辑日志可以认为就是存储的 SQL 本身,而物理日志看看 redo_log 存储的是啥就知道了,关于 page_id 页 ID,offset 偏移量啊这些东西,记录的是对页的修改。
另外物理日志可以保证幂等性,而逻辑日志则不一定能,除非本身 SQL 就是幂等的。
上面我们提到了 redo_log 的刷盘策略,binlog 就和它非常类似了,控制参数是sync_binlog
。
默认值为 0,相当于是innodb_flush_log_at_trx_commit
的值为 2,由文件系统控制,同样如果服务器宕机,binlog 丢失,当然我们也可以改成 1,就和 redo_log 的效果是一样,每 1 次事务提交都同步写入磁盘。
事务
为了保证写 redo_log 和 binlog 的一致性,实际采用了二阶段提交的方式。
prepare 阶段:根据innodb_flush_log_at_trx_commit
设置的刷盘策略决定是否写入磁盘,标记为 prepare 状态。
commit 阶段:写入 binlog 日志,事务标记为提交状态。
总结
版权声明: 本文为 InfoQ 作者【艾小仙】的原创文章。
原文链接:【http://xie.infoq.cn/article/90984ccd8a501c94c9d42a80f】。文章转载请联系作者。
评论