Mysql 篇 - 语句执行计划详解 (explain)
概述
使用 explain 输出 SELECT 语句执行的详细信息,包括以下信息:
表的加载顺序
sql 的查询类型
可能用到哪些索引,实际上用到哪些索引
读取的行数
Explain 执行计划包含字段信息如下:分别是 id、select_type、table、partitions、type、possible_keys、key、key_len、ref、rows、filtered、Extra 12 个字段。
通过 explain extended + show warnings 可以在原本 explain 的基础上额外提供一些查询优化的信息,得到优化以后的可能的查询语句(不一定是最终优化的结果)。
测试环境:
id
表示查询中执行 select 子句或者操作表的顺序,id 的值越大,代表优先级越高,越先执行
三个表依次嵌套,发现最里层的子查询 id 最大,最先执行。

select_type
表示 select 查询的类型,主要是用于区分各种复杂的查询,例如:普通查询、联合查询、子查询等。
SIMPLE:表示最简单的 select 查询语句,在查询中不包含子查询或者交并差集等操作。
PRIMARY:查询中最外层的 SELECT(存在子查询的外层的表操作为 PRIMARY)。
SUBQUERY:子查询中首个 SELECT。
DERIVED:被驱动的 SELECT 子查询(子查询位于 FROM 子句)。
UNION:在 SELECT 之后使用了 UNION
table
查询的表名,并不一定是真实存在的表,有别名显示别名,也可能为临时表。当 from 子句中有子查询时,table 列是<derivenN>的格式,表示当前查询依赖 id 为 N 的查询,会先执行 id 为 N 的查询。

partitions
查询时匹配到的分区信息,对于非分区表值为 NULL,当查询的是分区表时,partitions 显示分区表命中的分区情况。

type
查询使用了何种类型,它在 SQL 优化中是一个非常重要的指标
访问效率:const > eq_ref > ref > range > index > ALL
system
当表仅有一行记录时(系统表),数据量很少,往往不需要进行磁盘 IO,速度非常快。比如,Mysql 系统表 proxies_priv 在 Mysql 服务启动时候已经加载在内存中,对这个表进行查询不需要进行磁盘 IO。

const
单表操作的时候,查询使用了主键或者唯一索引。

eq_ref
多表关联查询的时候,主键和唯一索引作为关联条件。如下图的 sql,对于 user 表(外循环)的每一行,user_role 表(内循环)只有一行满足 join 条件,只要查找到这行记录,就会跳出内循环,继续外循环的下一轮查询。

ref
查找条件列使用了索引而且不为主键和唯一索引。虽然使用了索引,但该索引列的值并不唯一,这样即使使用索引查找到了第一条数据,仍然不能停止,要在目标值附近进行小范围扫描。但它的好处是不需要扫全表,因为索引是有序的,即便有重复值,也是在一个非常小的范围内做扫描。

ref_or_null
类似 ref,会额外搜索包含 NULL 值的行
index_merge
使用了索引合并优化方法,查询使用了两个以上的索引。新建 comment 表,id 为主键,value_id 为非唯一索引,执行 explain select content from comment where value_id = 1181000 and id > 1000;,执行结果显示查询同时使用了 id 和 value_id 索引,type 列的值为 index_merge。

range
有范围的索引扫描,相对于 index 的全索引扫描,它有范围限制,因此要优于 index。像 between、and、>、<、in 和 or 都是范围索引扫描。

index
index 包括 select 索引列,order by 主键两种情况。
order by 主键。这种情况会按照索引顺序全表扫描数据,拿到的数据是按照主键排好序的,不需要额外进行排序。

select 索引列。type 为 index,而且 extra 字段为 using index,也称这种情况为索引覆盖。所需要取的数据都在索引列,无需回表查询。

all
全表扫描,查询没有用到索引,性能最差。

possible_keys
此次查询中可能选用的索引。但这个索引并不定一会是最终查询数据时所被用到的索引。
key
此次查询中确切使用到的索引
ref
ref 列显示使用哪个列或常数与 key 一起从表中选择数据行。常见的值有 const、func、NULL、具体字段名。当 key 列为 NULL,即不使用索引时。如果值是 func,则使用的值是某个函数的结果。
以下 SQL 的执行计划 ref 为 const,因为使用了组合索引(user_id, blog_id),where user_id = 13 中 13 为常量
而下面这个 SQL 的执行计划 ref 值为 NULL,因为 key 为 NULL,查询没有用到索引。
rows
估算要找到所需的记录,需要读取的行数。评估 SQL 性能的一个比较重要的数据,mysql 需要扫描的行数,很直观的显示 SQL 性能的好坏,一般情况下 rows 值越小越好
filtered
存储引擎返回的数据在经过过滤后,剩下满足条件的记录数量的比例
extra
表示额外的信息说明。为了方便测试,这里新建两张表。
using where
表示在查询过程中使用了 WHERE 条件进行数据过滤。当一 个查询中包含 WHERE 条件时,MySQL 会根据该条件过滤出满足条件的数据行,然后再进行后续的操作。这个过程 就被称为"Using Where”。
表示查询的列未被索引覆盖,,且 where 筛选条件是索引列前导列的一个范围,或者是索引列的非前导列,或者是非索引列。对存储引擎返回的结果进行过滤(Post-filter,后过滤),一般发生在 MySQL 服务器,而不是存储引擎层,因此需要回表查询数据。

using index
查询的列被索引覆盖,并且 where 筛选条件符合最左前缀原则,通过索引查找就能直接找到符合条件的数据,不需要回表查询数据。

Using where&Using index
查询的列被索引覆盖,但无法通过索引查找找到符合条件的数据,不过可以通过索引扫描找到符合条件的数据,也不需要回表查询数据。
包括两种情况(组合索引为(user_id, orde)):
where 筛选条件不符合最左前缀原则

where 筛选条件是索引列前导列的一个范围

null
查询的列未被索引覆盖,并且 where 筛选条件是索引的前导列,也就是用到了索引,但是部分字段未被索引覆盖,必须回表查询这些字段,Extra 中为 NULL。

using index condition
索引下推(index condition pushdown,ICP),先使用 where 条件过滤索引,过滤完索引后找到所有符合索引条件的数据行,随后用 WHERE 子句中的其他条件去过滤这些数据行。
对于联合索引(a, b),在执行 select * from table where a > 1 and b = 2 语句的时候,只有 a 字段能用到索引,那在联合索引的 B+Tree 找到第一个满足条件的主键值(ID 为 2)后,还需要判断其他条件是否满足(看 b 是否等于 2),那是在联合索引里判断?还是回主键索引去判断呢?MySQL 5.6 引入的索引下推优化(index condition pushdown), 可以在联合索引遍历过程中,对联合索引中包含的字段先做判断,直接过滤掉不满足条件的记录,减少回表次数。
不使用 ICP 的情况(set optimizer_switch='index_condition_pushdown=off'),如下图,在步骤 4 中,没有使用 where 条件过滤索引:

使用 ICP 的情况(set optimizer_switch='index_condition_pushdown=on'):

下面的例子使用了 ICP:

关掉 ICP 之后(set optimizer_switch='index_condition_pushdown=off'),可以看到 extra 列为 using where,不会使用索引下推。

using temporary
使用了临时表保存中间结果,常见于 order by 和 group by 中。典型的,当 group by 和 order by 同时存在,且作用于不同的字段时,就会建立临时表,以便计算出最终的结果集
filesort
文件排序。表示无法利用索引完成排序操作,以下情况会导致 filesort:
order by 的字段不是索引字段
select 查询字段不全是索引字段
select 查询字段都是索引字段,但是 order by 字段和索引字段的顺序不一致

using join buffer
Block Nested Loop,需要进行嵌套循环计算。两个关联表 join,关联字段均未建立索引,就会出现这种情况。比如内层和外层的 type 均为 ALL,rows 均为 4,需要循环进行4*4
次计算。常见的优化方案是,在关联字段上添加索引,避免每次嵌套循环计算。
文章转载自:Seven
评论