MySQL-索引优化篇(1)_安装演示库 & [前缀索引、联合索引、覆盖索引] & explain参数

官方文档

https://dev.mysql.com/doc/

如果英文不好的话，可以参考 searchdoc 翻译的中文版本

http://www.searchdoc.cn/rdbms/mysql/dev.mysql.com/doc/refman/5.7/en/index.com.coder114.cn.html

安装演示数据库sakila

代码语言：javascript复制

[root@artisan ~]# wget http://downloads.mysql.com/docs/sakila-db.tar.gz
.....
.....
.....
2020-02-01 21:31:15 (2.74 KB/s) - ‘sakila-db.tar.gz’ saved [732161/732161]

[root@artisan ~]# tar -xvzf sakila-db.tar.gz 
sakila-db/
sakila-db/sakila-data.sql
sakila-db/sakila-schema.sql
sakila-db/sakila.mwb
[root@artisan ~]# cd sakila-db
[root@artisan sakila-db]# ls
sakila-data.sql  sakila.mwb  sakila-schema.sql
[root@artisan sakila-db]# mysql -uroot -p < sakila-schema.sql 
Enter password: 
[root@artisan sakila-db]# mysql -uroot -p < sakila-data.sql 
Enter password: 
[root@artisan sakila-db]#

索引优化策略

索引列上不能使用表达式或者函数

举个例子

代码语言：javascript复制

select  .... from t_order
where to_days(out_date) - to_days(current_date) < = 30

即使我们在out_date建立了 B树索引，因为使用了函数to_days，无法走索引。

那该如何改造呢？ ------------> 如下

代码语言：javascript复制

select  .... from t_order
where out_date <= data_add(current_date , interval 30 day) ;

前缀索引和索引列的选择性

当索引是很长的字符序列（比如BLOB,TEXT,或者很长的VARCHAR）时，这个索引将会很占内存，而且会很慢，这时候就会用到前缀索引了。所谓的前缀索引就是去索引的前面几个字母作为索引，但是要降低索引的重复率，索引我们还必须要判断前缀索引的重复率

前缀索引的创建

创建前缀索引

代码语言：javascript复制

create index index_name on table(col_name(n));

注意建立索引的区别 col_name(n)

这个n的长度，取悦于存储引擎

innodb 最大767个字节
myIsam 最大1000个直接

索引列的选择性

索引的选择性是指不重复的索引值和表的记录数的比值

选择性越高，查询效率越快。因为选择性高的索引可以让MySQL在查找时过滤掉更多的行。唯一索引的选择性是1，这是最好的索引选择性，性能也是最好的。

举个例子：

有4条记录

如果前缀索引，我们创建的时候，长度设置的是2 ，那么

不重复的索引为 2 ，总记录数为4 ，索引选择性 0.5

如果设置为 3 ，则

不重复的索引为 4 ，总记录数为4 ，索引选择性1 . 此时，性能最高，因为不用过滤数据啊。

合理选择，对提高查询性能帮助很大

前缀索引的优缺点

优点：

前缀索引是一种能使索引更小，更快的有效办法。

缺点：

mysql无法使用其前缀索引做ORDER BY和GROUP BY，也无法使用前缀索引做覆盖扫描。

联合索引

如何选择索引列的顺序

经常会被使用到的列优先，放到联合索引的最左边。但也不是绝对的，举个例子有个状态 state，就几个值，选择性很差（因为根据每个state，筛选出来的数据太多了。。。）就不适合放到联合索引的最左边，放到了最左边，mysql也不一定使用
选择性高的列优先。啥叫选择性高的列？比如根据这个列经过筛选后，能够把大部分的数据都过滤掉，之剩下很少的数据，那么就可以把这列称为选择性高的列。
宽度小的列优先当然了有个前提，不违反选择性。宽度小意味着I/O 少，效率高

覆盖索引

定义

覆盖索引: 如果一个索引包含(或覆盖)所有需要查询的字段的值 ,简言之----->只需扫描索列而无须回表查非索引列的字段。

优点

可优化缓存，减少磁盘I/O操作举个例子：一个表 15个字段，索引字段 3个，我们就查询这3个索引列的值，而不用回表，查询的字段少，可以缓存更多的数据，同时从内存中获取，可以极大的减少磁盘I/O操作
可以减少随机I/O, 变随机I/O为顺序I/O操作
可以避免对Innodb主键索引的二次查询
可以避免MyISAM表进行系统调用

无法使用覆盖索引的情况

有些存储引擎不支持覆盖索引
如果查询中使用了太多的列，尤其是那种查询全部字段的，或者 select * 的
使用了双% 号的like查询

演示

我们用刚才导入的 sakila 数据来演示下

select * 无法使用覆盖索引的演示：

代码语言：javascript复制

[root@artisan sakila-db]# mysql -uroot -p
Enter password: 
Welcome to the MySQL monitor.  Commands end with ; or g.
Your MySQL connection id is 63
Server version: 5.7.29-log MySQL Community Server (GPL)
.......
.......
mysql> show databases;
 -------------------- 
| Database           |
 -------------------- 
| information_schema |
| artisan            |
| artisanBinLog      |
| data               |
| mysql              |
| performance_schema |
| sakila             |
| sys                |
 -------------------- 
8 rows in set (0.01 sec)

mysql> use sakila;
No connection. Trying to reconnect...
Connection id:    64
Current database: *** NONE ***

Reading table information for completion of table and column names
You can turn off this feature to get a quicker startup with -A

Database changed
mysql> show tables;
 ---------------------------- 
| Tables_in_sakila           |
 ---------------------------- 
| actor                      |
| actor_info                 |
| address                    |
| category                   |
| city                       |
| country                    |
| customer                   |
| customer_list              |
| film                       |
| film_actor                 |
| film_category              |
| film_list                  |
| film_text                  |
| inventory                  |
| language                   |
| nicer_but_slower_film_list |
| payment                    |
| rental                     |
| sales_by_film_category     |
| sales_by_store             |
| staff                      |
| staff_list                 |
| store                      |
 ---------------------------- 
23 rows in set (0.00 sec)

mysql> desc film;
 ---------------------- --------------------------------------------------------------------- ------ ----- ------------------- ----------------------------- 
| Field                | Type                                                                | Null | Key | Default           | Extra                       |
 ---------------------- --------------------------------------------------------------------- ------ ----- ------------------- ----------------------------- 
| film_id              | smallint(5) unsigned                                                | NO   | PRI | NULL              | auto_increment              |
| title                | varchar(128)                                                        | NO   | MUL | NULL              |                             |
| description          | text                                                                | YES  |     | NULL              |                             |
| release_year         | year(4)                                                             | YES  |     | NULL              |                             |
| language_id          | tinyint(3) unsigned                                                 | NO   | MUL | NULL              |                             |
| original_language_id | tinyint(3) unsigned                                                 | YES  | MUL | NULL              |                             |
| rental_duration      | tinyint(3) unsigned                                                 | NO   |     | 3                 |                             |
| rental_rate          | decimal(4,2)                                                        | NO   |     | 4.99              |                             |
| length               | smallint(5) unsigned                                                | YES  |     | NULL              |                             |
| replacement_cost     | decimal(5,2)                                                        | NO   |     | 19.99             |                             |
| rating               | enum('G','PG','PG-13','R','NC-17')                                  | YES  |     | G                 |                             |
| special_features     | set('Trailers','Commentaries','Deleted Scenes','Behind the Scenes') | YES  |     | NULL              |                             |
| last_update          | timestamp                                                           | NO   |     | CURRENT_TIMESTAMP | on update CURRENT_TIMESTAMP |
 ---------------------- --------------------------------------------------------------------- ------ ----- ------------------- ----------------------------- 
13 rows in set (0.00 sec)


#  查询 索引列  language_id    重点看  Extra 



mysql> explain select language_id from film where language_id = 1 G ;
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: film
   partitions: NULL
         type: ref
possible_keys: idx_fk_language_id  -----> 可能用的索引 
          key: idx_fk_language_id     ----------------> 实际使用的索引
      key_len: 1
          ref: const
         rows: 1000
     filtered: 100.00
        Extra: Using index  ---------------->使用了索引，因为仅查询了索引列，这里就是覆盖索引
1 row in set, 1 warning (0.07 sec)

ERROR: 
No query specified

# 查看执行计划   重点看  Extra 

mysql> explain select *  from film where language_id = 1 G ;
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: film
   partitions: NULL
         type: ALL  ---------------------->  连接类型
possible_keys: idx_fk_language_id  -----> 可用的索引
          key: NULL    ----------------> 实际的索引
      key_len: NULL
          ref: NULL
         rows: 1000
     filtered: 100.00
        Extra: Using where  -------------------->   using where：表示优化器需要通过索引回表查询数据；
1 row in set, 1 warning (0.00 sec)

ERROR: 
No query specified

mysql>

在来看个例子

代码语言：javascript复制

mysql> show create table actor G ;
*************************** 1. row ***************************
       Table: actor
Create Table: CREATE TABLE `actor` (
  `actor_id` smallint(5) unsigned NOT NULL AUTO_INCREMENT,
  `first_name` varchar(45) NOT NULL,
  `last_name` varchar(45) NOT NULL,
  `last_update` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
  PRIMARY KEY (`actor_id`),
  KEY `idx_actor_last_name` (`last_name`)
) ENGINE=InnoDB AUTO_INCREMENT=201 DEFAULT CHARSET=utf8mb4
1 row in set (0.00 sec)

ERROR: 
No query specified

mysql> explain select actor_id , last_name from actor where last_name = 'Joe' G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: actor
   partitions: NULL
         type: ref
possible_keys: idx_actor_last_name
          key: idx_actor_last_name
      key_len: 182
          ref: const
         rows: 1
     filtered: 100.00
        Extra: Using index   ------> using index 表示直接访问索引就足够获取到所需要的数据，不需要通过索引回表；
1 row in set, 1 warning (0.30 sec)

主键 actor_id ，默认就是索引，所以虽然增加了 actor_id , last_name也是索引列（创建primary key的时候肯定会创建一个unique index。），所以这个查询也是使用了覆盖索引。

explain的几个参数的说明

代码语言：javascript复制

        id: 1
  select_type: SIMPLE
        table: actor
   partitions: NULL
         type: ref
possible_keys: idx_actor_last_name
          key: idx_actor_last_name
      key_len: 182
          ref: const
         rows: 1
     filtered: 100.00
        Extra: Using index

id
select_type: 查询中每个select子句的类型 (1) SIMPLE(简单SELECT,不使用UNION或子查询等) (2) PRIMARY(查询中若包含任何复杂的子部分,最外层的select被标记为PRIMARY) (3) UNION(UNION中的第二个或后面的SELECT语句) (4) DEPENDENT UNION(UNION中的第二个或后面的SELECT语句，取决于外面的查询) (5) UNION RESULT(UNION的结果) (6) SUBQUERY(子查询中的第一个SELECT) (7) DEPENDENT SUBQUERY(子查询中的第一个SELECT，取决于外面的查询) (8) DERIVED(派生表的SELECT, FROM子句的子查询) (9) UNCACHEABLE SUBQUERY(一个子查询的结果不能被缓存，必须重新评估外链接的第一行)

type 代表连接类型常用的类型有： ALL, index, range, ref, eq_ref, const, system, NULL 从左到右，性能从差到好， ALL 最差， NULL最好 ALL：Full Table Scan， MySQL将遍历全表以找到匹配的行 index: Full Index Scan，index与ALL区别为index类型只遍历索引树 range:只检索给定范围的行，使用一个索引来选择行 ref: 表示上述表的连接匹配条件，即哪些列或常量被用于查找索引列上的值 eq_ref: 类似ref，区别就在使用的索引是唯一索引，对于每个索引键值，表中只有一条记录匹配，简单来说，就是多表连接中使用primary key或者 unique key作为关联条件 const、system: 当MySQL对查询某部分进行优化，并转换为一个常量时，使用这些类型访问。如将主键置于where列表中，MySQL就能将该查询转换为一个常量,system是const类型的特例，当查询的表只有一行的情况下，使用system NULL: MySQL在优化过程中分解语句，执行时甚至不用访问表或索引，例如从一个索引列里选取最小值可以通过单独索引查找完成。

possible_keys: 可用的索引 ,实际不一定用
keys : MyQL实际的索引
key_len: 表示索引中使用的字节数
extra （需重点关注） 1) using tempoaray : 中间使用了临时表 2) using index 表示直接访问索引就足够获取到所需要的数据，不需要通过索引回表； 3) using index condition：5.6加入，会先条件过滤索引，过滤完索引后找到所有符合索引条件的数据行，随后用 WHERE 子句中的其他条件去过滤这些数据行； 4) using where：未使用索引，通过where条件过滤

自动驾驶数据库云数据库SQLServer sql

0 人点赞