学弟问我:explain 很重要吗?

2021-07-29 11:51:10 浏览数 (1)

哈喽,小伙伴们好呀。我是狗哥,今天打算跟大家聊聊一个很基础的 MySQL 命令 —— explain。这个命令相信很多小伙伴都熟悉并且几乎每天都会使用,反正我是这样的。那为什么还要写呢?

事情是这样的,周六有位大一小学弟问起我这个命令是不是很常用?

这个命令其实职场的兄弟们都很熟悉,但是对于一些学生来说,他们可能并不了解。所以就有了这篇文章。

如果你已经工作了就当复个习,我面试就真被问到了 type 的结果有几种?分别是啥意思?如果你还没毕业,那我倒是建议你去了解下,真的很重要。

话不多说了,国际惯例先上张本文的思维导图。PS:文末福利,电子书、大厂面试题以及 IDEA 激活,需要的文末获取~

往期精彩

MySQL 查询语句是怎么执行的?

MySQL 索引

MySQL 日志

MySQL 事务与 MVCC

MySQL 的锁机制

MySQL 字符串怎么设计索引?

面试官:数据库自增 ID 用完了会咋样?

面试官:order by 怎么优化?

面试官:count (*) 怎么优化?

01 explain 简介

explain 就是一个分析 sql 执行的命令,主要用于 select 语句(PS:其他语句我还没 explain 过。。。)通过它可以知道自己写的 sql 语句是否足够高效以及还有哪些可以优化的地方。

开篇之前声明下我的 MySQL 版本是:5.6.46,PS:5.6 之前的版本只能对 select 语句进行 explain,之后的版本可以对其他命令

开始之前我建了三张表并造了一些测试数据:

代码语言:javascript复制
DROP TABLE IF EXISTS `actor`;
CREATE TABLE `actor` (
  `id` int(11) NOT NULL,
  `name` varchar(45) DEFAULT NULL,
  `update_time` datetime DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

INSERT INTO `actor` (`id`, `name`, `update_time`) VALUES (1,'a','2021-07-11 14:39:53'), (2,'b','2021-07-11 10:39:53'), (3,'c','2021-07-11 10:24:39');

DROP TABLE IF EXISTS `film`;
CREATE TABLE `film` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(10) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

INSERT INTO `film` (`id`, `name`) VALUES (3,'film0'),(1,'film1'),(2,'film2');

DROP TABLE IF EXISTS `film_actor`;
CREATE TABLE `film_actor` (
  `id` int(11) NOT NULL,
  `film_id` int(11) NOT NULL,
  `actor_id` int(11) NOT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_film_actor_id` (`film_id`,`actor_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

INSERT INTO `film_actor` (`id`, `film_id`, `actor_id`) VALUES (1,1,1),(2,1,2),(3,2,1);

1.1 初体验

explain 的使用非常简单,在 sql 前面加 explain 即可:

代码语言:javascript复制
explain select * from film;

除此以外 mysql 还有以下两个扩展,这个知道即可。

1.1.1 explain extended

它会在 explain 的基础上额外提供一些查询优化的信息,从下图可以看出。它比 explain 多了一个 filtered 列,是一个百分比值,rows * filtered/100 可以估算出将要和 explain 中前一个表进行连接的行数(前一个表指 explain 中的 id 值比当前表 id 值小的表

跟 show warnings 两条语句一起执行,MySQL 就会给出优化后的 sql 语句,可以看出 MySQL 帮我们优化了什么。

1.1.2 explain partitions

比 explain 多了个 partitions 字段,如果查询是基于分区表的话,会显示查询将访问的分区。

02 为什么要用 explain?

原因很简单。通过 explain 命令我们可以学习到该条 sql 是如何执行的,随后解析 explain 的结果可以帮助我们使用更好的索引,最终来优化它!

通过 explain 命令我们可以知道以下信息:表的读取顺序,数据读取操作的类型,哪些索引可以使用,哪些索引实际使用了,表之间的引用,每张表有多少行被优化器查询等信息。

03 读懂 explain 的结果列

从上图我们可以知道:explain 命令输出的结果有 10 列,分别是:id、select_type、table、type、possible_keys、key、key_len、ref、rows、Extra

接下来我将逐一分析这些结果列代表的含义,希望对你有帮助:

3.1 id 列

一组数字,表示 sql 语句中 select 的执行顺序,有几个 select 就有几个 id,按照 select 出现的顺序呈现结果。

有几种情况:

  • id 相同,执行顺序由上而下
  • id 不同,序号会递增。值越大优先级越高,就越先执行

3.2 select_type 列

见名知义,就是 select 查询的类型,它的结果有好多种,且听我分析,加粗的都是常见的,得知道意思

  1. simple:简单查询。查询不包含子查询和 union,比如上面简介中演示的语句
  2. primary:跟上面相反,如果查询包含子查询和 union,就会被标记为 primary
  3. subquery:见名知义,包含在 select 中的子查询(不在 from 子句中
  4. derived:在 from 子句中子查询,MySQL 会将结果存放在一个临时表中,也称为派生表(derived 的英文含义)

举个例子,你就知道它们的的区别了:

代码语言:javascript复制
explain select (select 1 from actor where id = 1) from (select * from film where id = 1) alias;
  1. union:表示此查询是 UNION 中的第二个或随后的查询
  2. union result:从 union 临时表检索结果的 select

举个栗子,帮助你们分清楚区别:

代码语言:javascript复制
explain select 1 union all select 1;
  1. dependent union:此查询是 UNION 中的第二个或随后的查询,其次取决于外面的查询
  2. uncacheable union:此查询是 UNION 中的第二个或随后的查询,同时意味着 select 中的某些特性阻止结果被缓存于一个 Item_cache 中
  3. dependent subquery:子查询中的 第一个 select,同时取决于外面的查询
  4. uncacheable subquery:子查询中的 第一个 select,同时意味着 select 中的某些特性阻止结果被缓存于一个 Item_cache 中

PS:只需要弄懂前四个即可,其他的知道就好。

3.3 table 列

表示 explain 的一行访问的表是哪一个

  • 当 from 子句中有子查询时,table 列是 <derivenN> 格式,表示当前查询依赖 id=N 的查询,于是先执行 id=N 的查询
  • 当有 union 时,UNION RESULT 的 table 列的值为 <union1,2>,1 和 2 表示参与 union 的 select 行 id

3.4 type 列

表关联类型或访问类型,重要的一列,是判断查询是否高效的一句:也就是 MySQL 决定如何查找表中的行就看这个列。

结果有很多,性能从最优到最差为:system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL

我就挑几个常见的取值聊聊,没聊到的证明我也没遇到过,哈哈哈:

  1. ALL:全表扫描,性能极差。敲黑板哈,这种类型是不应该出现的,一定还可以加索引优化。
  2. index:全索引扫描,跟 ALL 差不多,不同的是 index 是扫描整棵索引树,比 ALL 要快些。
  3. range:范围扫描,通常出现在 in (), between ,> ,<, >= 等操作中。使用一个索引来检索给定范围的行。
  4. ref:索引查找,不使用唯一索引,使用普通索引或者唯一性索引的部分前缀,索引要和某个值相比较,可能会找到多个符合条件的行。
  5. eq_ref:最多只返回一条符合条件的记录。在使用唯一性索引或主键查找时会出现该值,非常高效。
  6. const、system:该表至多有一个匹配行,在查询开始时读取,或者该表是系统表,只有一行匹配。其中 const 用于在和 primary key 或 unique 索引中有固定值比较的情形。
  7. null:在执行阶段用不着再访问表或索引。

3.5 possible_keys 列

表示 MySQL 执行查询可能会使用那些索引来查找,如果为 null,可考虑在该列加个索引。

3.6 key 列

表示 MySQL 执行查询实际使用那些索引来查找,如果为 null,则证明没有使用索引。如果想强制使用或者忽略索引可以在查询语句加 force index(想要强制使用的索引名)或者 ignore index(想要忽略的索引名)

PS:如果 possible_keys 有列,而 key 显示 null 的情况,可能是因为表数据不多,加索引作用也不大。

3.7 key_len 列

在索引里使用的字节数,当 key 列的值为 NULL 时,则该列也是 NULL

PS:索引的最大长度是 768 字节,字符串过长时,MySQL 会将前半部分提出来做索引,这点大家需要注意。(不过一般我们也不会在这么长的字段上建索引)

3.8 ref 列

那些字段或者常量被用来和 key 列记录的索引配合查找值,常见的有:const(常量),func,NULL,字段名(例:film.id)

3.9 rows 列

这一列是 mysql 估计要读取并检测的行数,注意这个不是结果集里的行数。(只是个预测的数量)

3.10 Extra 列

额外信息,也非常重要

  • Using index:使用覆盖索引,表示查询索引就可查到所需数据,不用回表,说明性能不错。
  • Using where:在存储引擎检索行后再进行过滤,就是先读取整行数据,再按 where 条件进行取舍。
  • Using temporary:mysql 需要创建一张临时表来处理查询,一般是因为查询语句中有排序、分组、和多表 join 的情况,一般是要进行优化的。
  • Using filesort:对结果使用一个外部索引排序,而不是按索引次序从表里读取行,一般有出现该值,都建议优化去掉,因为这样的查询 CPU 资源消耗大。

04 总结

其实 explain 并不难,我们需要关注的结果列也只有 select_type、type 以及 extra 列。这是非常基础的一个命令,各位在校生小伙伴非常建议你提前了解下。

参考

  • 《高性能 MySQL》
  • MySQL 官方文档
    • https://dev.mysql.com/doc/refman/5.7/en/explain-output.html

05 idea 激活

微信经常有很多小伙伴,还不知道怎么激活 jetbrains 全家桶的,经常有人来问我咋整?我这边把破解补丁和安装教程都给整理出来了,有需要的直接点击阅读原文~

0 人点赞