Mysql 篇 - 语句执行计划详解 (explain)

2024-11-19
福建
本文字数：4807 字
阅读完需：约 16 分钟

概述

使用 explain 输出 SELECT 语句执行的详细信息，包括以下信息：

表的加载顺序
sql 的查询类型
可能用到哪些索引，实际上用到哪些索引
读取的行数

Explain 执行计划包含字段信息如下：分别是 id、select_type、table、partitions、type、possible_keys、key、key_len、ref、rows、filtered、Extra 12 个字段。

通过 explain extended + show warnings 可以在原本 explain 的基础上额外提供一些查询优化的信息，得到优化以后的可能的查询语句（不一定是最终优化的结果）。

测试环境：

CREATE TABLE `blog` (  `blog_id` int NOT NULL AUTO_INCREMENT COMMENT '唯一博文id--主键',  `blog_title` varchar(255) NOT NULL COMMENT '博文标题',  `blog_body` text NOT NULL COMMENT '博文内容',  `blog_time` datetime NOT NULL COMMENT '博文发布时间',  `update_time` timestamp NULL DEFAULT NULL ON UPDATE CURRENT_TIMESTAMP,  `blog_state` int NOT NULL COMMENT '博文状态--0 删除 1正常',  `user_id` int NOT NULL COMMENT '用户id',  PRIMARY KEY (`blog_id`)) ENGINE=InnoDB AUTO_INCREMENT=17 DEFAULT CHARSET=utf8
CREATE TABLE `user` (  `user_id` int NOT NULL AUTO_INCREMENT COMMENT '用户唯一id--主键',  `user_name` varchar(30) NOT NULL COMMENT '用户名--不能重复',  `user_password` varchar(255) NOT NULL COMMENT '用户密码',  PRIMARY KEY (`user_id`),  KEY `name` (`user_name`)) ENGINE=InnoDB AUTO_INCREMENT=17 DEFAULT CHARSET=utf8
CREATE TABLE `discuss` (  `discuss_id` int NOT NULL AUTO_INCREMENT COMMENT '评论唯一id',  `discuss_body` varchar(255) NOT NULL COMMENT '评论内容',  `discuss_time` datetime NOT NULL COMMENT '评论时间',  `user_id` int NOT NULL COMMENT '用户id',  `blog_id` int NOT NULL COMMENT '博文id',  PRIMARY KEY (`discuss_id`)) ENGINE=InnoDB AUTO_INCREMENT=61 DEFAULT CHARSET=utf8

复制代码

id

表示查询中执行 select 子句或者操作表的顺序，id 的值越大，代表优先级越高，越先执行

explain select discuss_body from discuss where blog_id = (    select blog_id from blog where user_id = (        select user_id from user where user_name = 'admin'));

复制代码

三个表依次嵌套，发现最里层的子查询 id 最大，最先执行。

select_type

表示 select 查询的类型，主要是用于区分各种复杂的查询，例如：普通查询、联合查询、子查询等。

SIMPLE：表示最简单的 select 查询语句，在查询中不包含子查询或者交并差集等操作。
PRIMARY：查询中最外层的 SELECT（存在子查询的外层的表操作为 PRIMARY）。
SUBQUERY：子查询中首个 SELECT。
DERIVED：被驱动的 SELECT 子查询（子查询位于 FROM 子句）。
UNION：在 SELECT 之后使用了 UNION

table

查询的表名，并不一定是真实存在的表，有别名显示别名，也可能为临时表。当 from 子句中有子查询时，table 列是<derivenN>的格式，表示当前查询依赖 id 为 N 的查询，会先执行 id 为 N 的查询。

partitions

查询时匹配到的分区信息，对于非分区表值为 NULL，当查询的是分区表时，partitions 显示分区表命中的分区情况。

type

查询使用了何种类型，它在 SQL 优化中是一个非常重要的指标

访问效率：const > eq_ref > ref > range > index > ALL

system

当表仅有一行记录时（系统表），数据量很少，往往不需要进行磁盘 IO，速度非常快。比如，Mysql 系统表 proxies_priv 在 Mysql 服务启动时候已经加载在内存中，对这个表进行查询不需要进行磁盘 IO。

const

单表操作的时候，查询使用了主键或者唯一索引。

eq_ref

多表关联查询的时候，主键和唯一索引作为关联条件。如下图的 sql，对于 user 表（外循环）的每一行，user_role 表（内循环）只有一行满足 join 条件，只要查找到这行记录，就会跳出内循环，继续外循环的下一轮查询。

ref

查找条件列使用了索引而且不为主键和唯一索引。虽然使用了索引，但该索引列的值并不唯一，这样即使使用索引查找到了第一条数据，仍然不能停止，要在目标值附近进行小范围扫描。但它的好处是不需要扫全表，因为索引是有序的，即便有重复值，也是在一个非常小的范围内做扫描。

ref_or_null

类似 ref，会额外搜索包含 NULL 值的行

index_merge

使用了索引合并优化方法，查询使用了两个以上的索引。新建 comment 表，id 为主键，value_id 为非唯一索引，执行 explain select content from comment where value_id = 1181000 and id > 1000;，执行结果显示查询同时使用了 id 和 value_id 索引，type 列的值为 index_merge。

range

有范围的索引扫描，相对于 index 的全索引扫描，它有范围限制，因此要优于 index。像 between、and、>、<、in 和 or 都是范围索引扫描。

index

index 包括 select 索引列，order by 主键两种情况。

order by 主键。这种情况会按照索引顺序全表扫描数据，拿到的数据是按照主键排好序的，不需要额外进行排序。

select 索引列。type 为 index，而且 extra 字段为 using index，也称这种情况为索引覆盖。所需要取的数据都在索引列，无需回表查询。

all

全表扫描，查询没有用到索引，性能最差。

possible_keys

此次查询中可能选用的索引。但这个索引并不定一会是最终查询数据时所被用到的索引。

key

此次查询中确切使用到的索引

ref

ref 列显示使用哪个列或常数与 key 一起从表中选择数据行。常见的值有 const、func、NULL、具体字段名。当 key 列为 NULL，即不使用索引时。如果值是 func，则使用的值是某个函数的结果。

以下 SQL 的执行计划 ref 为 const，因为使用了组合索引(user_id, blog_id)，where user_id = 13 中 13 为常量

mysql> explain select blog_id from user_like where user_id = 13;+----+-------------+-----------+------------+------+---------------+------+---------+-------+------+----------+-------------+| id | select_type | table     | partitions | type | possible_keys | key  | key_len | ref   | rows | filtered | Extra       |+----+-------------+-----------+------------+------+---------------+------+---------+-------+------+----------+-------------+|  1 | SIMPLE      | user_like | NULL       | ref  | ul1,ul2       | ul1  | 4       | const |    2 |   100.00 | Using index |+----+-------------+-----------+------------+------+---------------+------+---------+-------+------+----------+-------------+

复制代码

而下面这个 SQL 的执行计划 ref 值为 NULL，因为 key 为 NULL，查询没有用到索引。

mysql> explain select user_id from user_like where status = 1;+----+-------------+-----------+------------+------+---------------+------+---------+------+------+----------+-------------+| id | select_type | table     | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |+----+-------------+-----------+------------+------+---------------+------+---------+------+------+----------+-------------+|  1 | SIMPLE      | user_like | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    6 |    16.67 | Using where |+----+-------------+-----------+------------+------+---------------+------+---------+------+------+----------+-------------+

复制代码

rows

估算要找到所需的记录，需要读取的行数。评估 SQL 性能的一个比较重要的数据，mysql 需要扫描的行数，很直观的显示 SQL 性能的好坏，一般情况下 rows 值越小越好

filtered

存储引擎返回的数据在经过过滤后，剩下满足条件的记录数量的比例

extra

表示额外的信息说明。为了方便测试，这里新建两张表。

CREATE TABLE `t_order` (  `id` int NOT NULL AUTO_INCREMENT,  `user_id` int DEFAULT NULL,  `order_id` int DEFAULT NULL,  `order_status` tinyint DEFAULT NULL,  `create_date` datetime DEFAULT NULL,  PRIMARY KEY (`id`),  KEY `idx_userid_order_id_createdate` (`user_id`,`order_id`,`create_date`)) ENGINE=InnoDB AUTO_INCREMENT=99 DEFAULT CHARSET=utf8
CREATE TABLE `t_orderdetail` (  `id` int NOT NULL AUTO_INCREMENT,  `order_id` int DEFAULT NULL,  `product_name` varchar(100) DEFAULT NULL,  `cnt` int DEFAULT NULL,  `create_date` datetime DEFAULT NULL,  PRIMARY KEY (`id`),  KEY `idx_orderid_productname` (`order_id`,`product_name`)) ENGINE=InnoDB AUTO_INCREMENT=152 DEFAULT CHARSET=utf8

复制代码

using where

表示在查询过程中使用了 WHERE 条件进行数据过滤。当一个查询中包含 WHERE 条件时，MySQL 会根据该条件过滤出满足条件的数据行，然后再进行后续的操作。这个过程就被称为"Using Where”。

表示查询的列未被索引覆盖，，且 where 筛选条件是索引列前导列的一个范围，或者是索引列的非前导列，或者是非索引列。对存储引擎返回的结果进行过滤（Post-filter，后过滤），一般发生在 MySQL 服务器，而不是存储引擎层，因此需要回表查询数据。

using index

查询的列被索引覆盖，并且 where 筛选条件符合最左前缀原则，通过索引查找就能直接找到符合条件的数据，不需要回表查询数据。

Using where&Using index

查询的列被索引覆盖，但无法通过索引查找找到符合条件的数据，不过可以通过索引扫描找到符合条件的数据，也不需要回表查询数据。

包括两种情况（组合索引为(user_id, orde)）：

where 筛选条件不符合最左前缀原则

where 筛选条件是索引列前导列的一个范围

null

查询的列未被索引覆盖，并且 where 筛选条件是索引的前导列，也就是用到了索引，但是部分字段未被索引覆盖，必须回表查询这些字段，Extra 中为 NULL。

using index condition

索引下推（index condition pushdown，ICP），先使用 where 条件过滤索引，过滤完索引后找到所有符合索引条件的数据行，随后用 WHERE 子句中的其他条件去过滤这些数据行。

对于联合索引（a, b），在执行 select * from table where a > 1 and b = 2 语句的时候，只有 a 字段能用到索引，那在联合索引的 B+Tree 找到第一个满足条件的主键值（ID 为 2）后，还需要判断其他条件是否满足（看 b 是否等于 2），那是在联合索引里判断？还是回主键索引去判断呢？MySQL 5.6 引入的索引下推优化（index condition pushdown)，可以在联合索引遍历过程中，对联合索引中包含的字段先做判断，直接过滤掉不满足条件的记录，减少回表次数。

不使用 ICP 的情况（set optimizer_switch='index_condition_pushdown=off'），如下图，在步骤 4 中，没有使用 where 条件过滤索引：

使用 ICP 的情况（set optimizer_switch='index_condition_pushdown=on'）：

下面的例子使用了 ICP：

explain select user_id, order_id, order_status from t_order where user_id > 1 and user_id < 5\G;

复制代码

关掉 ICP 之后（set optimizer_switch='index_condition_pushdown=off'），可以看到 extra 列为 using where，不会使用索引下推。

using temporary

使用了临时表保存中间结果，常见于 order by 和 group by 中。典型的，当 group by 和 order by 同时存在，且作用于不同的字段时，就会建立临时表，以便计算出最终的结果集

filesort

文件排序。表示无法利用索引完成排序操作，以下情况会导致 filesort：

order by 的字段不是索引字段
select 查询字段不全是索引字段
select 查询字段都是索引字段，但是 order by 字段和索引字段的顺序不一致

using join buffer

Block Nested Loop，需要进行嵌套循环计算。两个关联表 join，关联字段均未建立索引，就会出现这种情况。比如内层和外层的 type 均为 ALL，rows 均为 4，需要循环进行4*4次计算。常见的优化方案是，在关联字段上添加索引，避免每次嵌套循环计算。

文章转载自：Seven
原文链接：https://www.cnblogs.com/seven97-top/p/18554001
体验地址：http://www.jnpfsoft.com/?from=infoq

发布于: 刚刚阅读数: 4

EquatorCoco

关注

还未添加个人签名 2023-06-19 加入

还未添加个人简介

发布

暂无评论

创作场景

Mysql 篇 - 语句执行计划详解 (explain)

概述

id

select_type

table

partitions

type

system

const

eq_ref

ref

ref_or_null

index_merge

range

index

all

possible_keys

key

ref

rows

filtered

extra

using where

using index

Using where&Using index

null

using index condition

using temporary

filesort

using join buffer

EquatorCoco

评论