一、执行计划:
执行计划是SQL语句经过查询分析器后得到的 抽象语法树 和 相关表的统计信息 作出的一个查询方案,这个方案是由查询优化器自动分析产生的。由于是动态数据采样统计分析出来的结果,所以可能会存在分析错误的情况,也就是存在执行计划并不是最优的情况。
通过explain关键字知道MySQL是如何执行SQL查询语句的,分析select 语句的性能瓶颈,从而改进我们的查询,explain的结果如下:
下面是有关各列的详细介绍,重要的有id、type、key、key_len、rows、extra:
1、id:
id列的编号就是select 的序列号,可以理解为SQL执行顺序的标识,有几个select 就有几个id。
- (1)id值不同:id值越大优先级越高,越先被执行;
- (2)id值相同:从上往下依次执行;
- (3)id列为null:表示这是一个结果集,不需要使用它来进行查询。
2、select_type:
查询的类型,主要用于区分普通查询、联合查询、子查询等复杂的查询;
(1)simple:表示查询中不包括union操作或者子查询,位于最外层的查询的select_type即为simple,且只有一个;
explain select * from t3 where id=3952602;
(2)primary:需要union操作或者含有子查询的select,位于最外层的查询的select_type即为primary,且只有一个;
explain select * from (select * from t3 where id=3952602) a ;
(3)derived:from列表中出现的子查询,也叫做衍生表;mysql或者递归执行这些子查询,把结果放在临时表里。
explain select * from (select * from t3 where id=3952602) a ;
(4)subquery:除了from子句中包含的子查询外,其他地方出现的子查询都可能是subquery。
explain select * from t3 where id = (select id from t3 whereid=3952602 ) ;
(5)union:若第二个select出现在union之后,则被标记为union;若union包含在from子句的子查询中,外层select将被标记为derived。
explain select * from t3 where id=3952602 union all select * from t3;
(6)union result:从union表获取结果的select ,因为它不需要参与查询,所以id字段为null。
explain select * from t3 where id=3952602 union all select * from t3;
(7)dependent union:与union一样,出现在union 或union all语句中,但是这个查询要受到外部查询的影响;
(8)dependent subquery:与dependent union类似,子查询中的第一个SELECT,这个subquery的查询要受到外部表查询的影响。
3、table:
表示 explain 的一行正在访问哪个表。
- (1)如果查询使用了别名,那么这里显示的是别名;
- (2)如果不涉及对数据表的操作,那么这显示为null;
- (3)如果显示为尖括号括起来的
<derived N>
就表示这个是临时表,后边的N就是执行计划中的id,表示结果来自于这个查询产生; - (4)如果是尖括号括起来的
<union M,N>
,与<derived N>
类似,也是一个临时表,表示这个结果来自于union查询的id为M,N的结果集。
4、type:
访问类型,即MySQL决定如何查找表中的行。依次从好到差:system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL,除了all之外,其他的 type类型 都可以使用到索引,除了 index_merge 之外,其他的type只可以用到一个索引。一般要求type为ref,范围查找需要达到 range。
(1)system:表中只有一条元组匹配(等于系统表),这是 const 类型的特例,平时不会出现,可以忽略不计。
(2)const:通过索引一次就找到了,表示使用主键索引或者唯一索引。
(3)eq_ref:主键或者唯一索引中的所有字段被用于连接使用,只会返回一行匹配的数据。简单的select查询语句不会出现这种情况。
(4)ref:普通索引扫描,可能返回多个符合查询条件的行。
(5)fulltext:全文索引检索,全文索引的优先级很高,若全文索引和普通索引同时存在时,mysql不管代价,优先选择使用全文索引。
(6)ref_or_null:与ref方法类似,只是增加了null值的比较。
(7)index_merge:表示查询使用了两个以上的索引,索引合并的优化方法,最后取交集或者并集,常见and ,or的条件使用了不同的索引。
(8)unique_subquery:用于where中的in形式子查询,子查询返回不重复值唯一值;
(9)index_subquery:用于in形式子查询使用到了辅助索引或者in常数列表,子查询可能返回重复值,可以使用索引将子查询去重。
(9)range:索引范围扫描,常见于使用>,<,between ,in ,like等运算符的查询中。
(10)index:索引全表扫描,把索引树从头到尾扫描一遍;
(11)all:遍历全表以找到匹配的行(Index与ALL虽然都是读全表,但index是从索引中读取,而ALL是从硬盘读取)
(12)NULL: MySQL在优化过程中分解语句,执行时甚至不用访问表或索引。
5、possible_keys:
显示查询可能使用到的索引。
6、key:
实际使用哪个索引来优化对该表的访问;select_type为index_merge时,这里可能出现两个以上的索引,其他的select_type这里只会出现一个。
7、key_len:
实际上用于优化查询的索引长度,即索引中使用的字节数。通过这个值,可以计算出一个多列索引里实际使用了索引的哪写字段。key_len的计算规则:
字段类型 | 索引长度 |
---|---|
tinyint | 1字节 |
smallint | 2字节 |
int | 4字节 |
bigint | 8字节 |
date | 3字节 |
timestamp | 4字节 |
datetime | 8字节 |
char(n) | GBK编码:2n字节 utf8编码:3n字节 utf8mb4编码:4n字节 |
varchar(n) | GBK编码:(2n 2)字节 utf8编码:(3n 2)字节 utf8mb4编码:(4n 2)字节 |
注意:
(1)如果字段允许为 NULL,需要额外1字节记录是否为 NULL
(2)索引的最大长度为767字节,当字符串过长时,mysql会做类似左前缀索引的处理,将前半部分的字符提取出来做索引。
(3)key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的。
(4)key_len只计算where条件用到的索引长度,而排序和分组就算用到了索引,也不会计算到key_len中。
8、ref:
显示哪个字段或者常量与key一起被使用。
(1)如果是使用的常量等值查询,这里会显示const。
(2)如果是连接查询,被驱动表的执行计划这里会显示驱动表的关联字段。
(3)如果是条件使用了表达式或者函数,或者条件列发生了内部隐式转换,这里可能显示为func。
9、rows:
表示MySQL根据表统计信息及索引选用情况,大致估算此处查询需要读取的行数,不是精确值。
10、extra:
这一列展示一些额外信息,同样十分重要。这个列可以显示的信息非常多,有几十种,常用的有:
类型 | 说明 |
---|---|
using index | 使用覆盖索引 |
using index condition | 查询的列未被索引覆盖,where筛选条件是索引的前导列 |
using where | 查询的列未被索引覆盖,where筛选条件非索引的前导列 |
using index;using where | 查询的列被索引覆盖,where筛选条件非索引的前导列 |
NULL | (既没有using index,也没有using where; using index,也没有using where) 查询的列未被索引覆盖,并且where筛选条件是索引的前导列。意味着用到了索引,但是部分字段未被索引覆盖,须通过“回表”来获取查询所需的字段 |
using temporary | 用临时表保存中间结果,常用于GROUP BY 和 ORDER BY操作中,通常是因为group by的列上没有索引。也有可能是因为同时有group by和order by,但group by和order by的列又不一样,一般看到它说明查询需要优化了 |
using filesort | MySQL有两种方式对查询结果进行排序,一种是使用索引,另一种是filesort(基于快排实现的外部排序,性能比较差),当数据量很大时,这将是一个CPU密集型的过程,所以可以通过建立合适的索引来优化排序的性能 |
using join buffer | 使用了连接缓存:(1)Block Nested Loop:连接算法是块嵌套循环连接; (2)Batched Key Access:连接算法是批量索引连接 |
Not exists | MYSQL优化了LEFT JOIN,一旦它找到了匹配LEFT JOIN标准的行, 就不再搜索了 |
impossible where | where子句的值总是false |
distinct | 优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作 |
select tables optimized away | 在没有GROUP BY子句的情况下,基于索引优化MIN/MAX操作,或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化 |
11、filtered:
使用explain extended时会出现这个列,5.7之后的版本默认就有这个字段,不需要使用explain extended了。这个字段表示存储引擎返回的数据在server层过滤后,剩下多少满足查询的记录数量的比例,注意是百分比,不是具体记录数。
二、MySQL执行计划的局限性:
(1)EXPLAIN不会告诉你关于触发器、存储过程的信息或用户自定义函数对查询的影响情况;
(2)EXPLAIN不考虑各种Cache;
(3)EXPLAIN不能显示MySQL在执行查询时所作的优化工作;
(4)部分统计信息是估算的,并非精确值;
(5)EXPALIN只能解释SELECT操作,其他操作要重写为SELECT后查看。
三、案例分析:
执行顺序:
第一:(id = 4):【select id, name from t2】:select_type 为union,说明id=4的select是union里面的第二个select。
第二:(id = 3):【select id, name from t1 where address = ‘11’】:因为是在from语句中包含的子查询所以被标记为DERIVED(衍生),where address = ‘11’ 通过复合索引idx_name_email_address就能检索到,所以type为index。
第三:(id = 2):【select id from t3】:因为是在select中包含的子查询所以被标记为SUBQUERY。
第四:(id = 1):【select d1.name, … d2 from … d1】:select_type为PRIMARY表示该查询为最外层查询,table列被标记为 “derived3”表示查询结果来自于一个衍生表(id = 3 的select结果)。
第五:(id = NULL):【 … union … 】:代表从union的临时表中读取行的阶段,table列的 “union 1, 4”表示用id=1 和 id=4 的select结果进行union操作。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/100059.html原文链接:https://javaforall.cn