面试官:说说数据库事务吧!我:这还不简单
前言面试官在数据库这方面最常问的除了 sql 优化,还有数据库事务、存储引擎等相关知识。上期有人说没有自动门,所以这一期我特地造了自动门,这门没有四五块造不下来。注意:只是 CRUD 的搬砖工就不需要看了,看了也忘了,只需要拉到最后,点赞、转发、收藏,一键三连然后收藏起来就行了。什么是事务事务是指是程序中一系列严密的逻辑操作,而且所有操作必须全部成功完成,否则在每个操作中所作的所有更改都会被撤消。通俗点说就是要么一起活,要么一起死。
事务特性事务特性就是普通都知道的 ACID,那么什么是 ACID,估计有些货跟我之前一样,只知道这个词,不知道每个字母代表的是什么,这次就给翻译翻译什么叫 TMD 惊喜(不,说错了,是字母),我还特地下了一个有道词典,浪费了几十 M 的流量。
A:Atomicity 原子性所谓原子性就是说事务是一个最小的单元,跟原子一样不可再分割。一个事务中的所有操作要么全部成功,要么全部失败,通过 WAL(Write Ahead Log)实现。(HBASE 也应用了这个技术)I:Isolation 隔离性一个事务在操作还未结束之前,对其他事务是不可见的,即一个事务内部的操作及使用的数据对其他的并发事务是隔离的。锁和多版本控制就符合隔离性。类似于现在的共享文档:我在编辑文档未保存之前其他人是不可见的。D:Durability 持久性一旦事务提交,其所做的修改就会永久保存到数据库中。人也要学会持久,老子没开车。比如健身,深蹲蹲一半怎么行。C:Consistency 一致性数据库总是从一个一致性的状态转换到另外一个一致性的状态,也就是说在某个时间是 A,另一个时间是 B。所有事务对一个数据的读取结果都是相同的,这是由原子性、隔离性、持久性共同保证的结果。数据的完整性是通过其他三个特性来保证的,包括原子性、隔离性、持久性,而这三个特性,又是通过 Redo/Undo 来保证的,为了保证数据的完整性,提出来三个特性,这三个特性又是由同一个技术来实现的,所以理解 Redo/Undo 才能理解数据库的本质。
隔离级别 READ UNCOMMITTED 未提交读事务所做的修改,即使未提交,对其他事务也是可见的。事务可以读取未提交的数据,也称为脏读。也就是说能看见另一个人正在编辑的内容是什么,毫无隐私可言。READ COMMITTED 提交读,也称不可重复读一个事务从开始直到提交之前,所作的修改对其他事务是不可见的。也称为不可重复读,因为执行多次一样的查询,可能得到不一样的结果。跟未提交读正好相反,我只有保存了文档,你才能看得见。REPEATABLE READ 可重复读同一个事务中多次读取同样的记录的结果是一样的。可能导致幻读,在多次读取间隙中,可能有其它事务插入新的记录,就会出现幻读。
SERIALIZABLE 可串行化最高隔离级别,强制事务串行执行,避免了幻读的问题。也就是事务必须一个一个排队执行,没有插队的情况。并发事务问题脏读:一个事务正在对一条记录做修改,在这个事务完成并提交前,这条记录的数据就处于不一致状态;这时,另一个事务也来读取同一条记录,如果不加控制,第二个事务读取了这些“脏”数据,并据此做进一步的处理,就会产生未提交的数据依赖关系。这种现象被形象地叫作"脏读"(Dirty Reads)。所谓脏读,就是说我没提交别人都能看得到事务,那么后面我删除掉编辑的内容的话他没看,别人还是以为我编辑了内容。不可重复读一个事务在读取某些数据后的某个时间,再次读取以前读过的数据,却发现其读出的数据已经发生了改变、或某些记录已经被删除了!这种现象就叫作“ 不可重复读”(Non-Repeatable Reads)。
幻读一个事务按相同的查询条件重新读取以前检索过的数据,却发现其他事务插入了满足其查询条件的新数据,这种现象就称为“幻读”(Phantom Reads)。
「注意」不可重复读和幻读看起来很像,其实是有差别的。不可重复读重点在于 UPDATA 和 DELETE,而幻读的重点在于 INSERT
MVVC 多版本控制 MVCC(Multi-Version Concurrency Control),行级锁的一个变种,在很多情况下避免了加锁操作,开销更低。通过保存数据在某个时间点的快照来实现。即是不管执行多长时间,每个事务看到的数据都是一致的。根据事务开始时间不同,每个事务对同一张表,同一时刻看到的数据可能是不一样的。其实就是在高并发的访问状态下,对数据进行多版本控制,并通过事务的可见性来保证事务能看到自己应该看到的数据版本。「那么多版本是如何生成的呢?」每一次对数据库的修改,都会在 Undo 日志中记录当前修改记录的事务号及修改前数据状态的存储地址(即 ROLL_PTR),以便在必要的时候可以回滚到老的数据版本。InnoDB 的 MVCC,是通过在每行记录后面保存两个隐藏的列来实现的。两列,一个保存了行的创建时间,一个保存了行的过期时间(或删除时间),存储的并不是实际的时间值,而是系统版本号。每开始一个事务,系统版本号都会自动递增。事务开始时刻的系统版本号会作为事务的版本号,用来和查询到的每行记录的版本号进行比较。MySQL 的 InnoDB 存储引擎实现隔离级别的一种具体方式,用于实现「提交读」和「可重复读」这两种隔离级别。而未提交读隔离级别总是读取最新的数据行,无需使用 MVCC。可串行化隔离级别需要对所有读取的行都加锁,单纯使用 MVCC 无法实现。快照读与当前读在 MVCC 并发控制中,读操作可以分为两类: 快照读(Snapshot Read)与当前读 (Current Read)。「快照读」:读取的是记录的可见版本(有可能是历史版本),不用加锁。「当前读」:读取的是记录的最新版本,并且当前读返回的记录,都会加锁,保证其他事务不会再并发修改这条记录。注意:MVCC 只在 Read Commited 和 Repeatable Read 两种隔离级别下工作。「如何区分快照读和当前读呢?」快照读:简单的 select 操作,属于快照读,不需要加锁。当前读:特殊的读操作,插入/更新/删除操作,属于当前读,需要加锁。最后觉得不错的小伙伴记得转发关注哦,后续会持续更新精选技术文章!
评论