MySQL-进阶

2022-08-30 14:31:57 浏览数 (1)

目录

  • 存储引擎
  • 索引
  • SQL优化
  • 视图/存储过程/触发器
  • InnoDB引擎
  • MySQL管理

第一章 存储引擎

  • MySQL体系结构
  • 存储引擎简介
  • 存储引擎特点
  • 存储引擎选择

一、MySQL体系架构

  • 连接层

最上层是一些客户端和链接服务,主要完成一些小类似于连接处理、授权认证、 及相关的安全方案。服务器也会为安全接入的每个用户端验证它所具有的操作权 限。

  • 服务层 第二层架构主要完成大多数的核心服务功能,如SQL接口,并完成缓存的查询,SQL的分析和优化,部分内置函数的执行。所有存储引擎的功能也在这一层实现,如过程、函数等。
  • 引擎层 存储引擎真正的负责了MySQL中数据的存储和提取,服务器通过API和存储引擎进行通信。不同的存储引擎具有不同的功能,这样我们可以根据自己的需要,来选取合适的存储引擎。
  • 存储层 主要是将数据存储在文件系统之上,并完成与存储引擎的交互。

二、存储引擎简介

存储引擎就是存储数据、建立索引、更新/查询数据等技术的实现方式。存储引擎是基于表的,而不是基于库的,所以存储引擎也可被称为表类型。

在创建表时,指定存储引擎(默认InnoDB)

代码语言:javascript复制
create table 表名(
  字段1 字段1类型 [comment 字段1注释],
   ...
   字段2 字段2类型 [comment 字段2注释],
)engine = innodb [comment 表注释];

查看当前数据库支持的存储引擎

代码语言:javascript复制
show engines;

三、存储引擎特点

  • InnoDB
    • xxx.ibd:xxx代表的是表名,innoDB引擎的每张表都会对应这样一个表空间文件,存储该表的结构(frm、sdi)、数据和索引。参数:innodb_file_per_table
    • DML操作遵循ACID模型,支持事务;
    • 行级锁,提高并发访问性能;
    • 支持外键FOREING KEY约束,保证数据的完整性和正确性。
    • InnoDB是一种兼顾高可靠性和高性能的通用存储引擎,在MySQL5.5之后,InnoDB是默认的MySQL存储引擎
    • 介绍
    • 特点
    • 文件
  • MyISAM
    • xxx.sdi:存储表结构信息
    • xxx.MYD:存储数据
    • xxx.MYI:存储索引
    • 不支持事务,不支持外键
    • 支持表锁,不支持行锁
    • 访问速度快
    • MyISAM是MySQL早期的默认存储引擎
    • 介绍
    • 特点
    • 文件
  • Memory
    • xxx.sdi:存储表结构信息
    • 内存存放
    • hash索引(默认)
    • Memory引擎的表数据是存储在内存中的,由于受到硬件问题、或断电问题的影响,只能将这些表作为临时表或缓存使用
    • 介绍
    • 特点
    • 文件

四、存储引擎选择

在选择存储引擎时,应该根据应用系统的特点选择合适的存储引擎。对于复杂的应用系统,还可以根据实际情况选择多种存储引擎进行组合。

  • InnoDB:是MySQL的默认存储引擎,支持事务、外键。如果应用对事务的完整性有比较高的要求,在并发条件下要求数据的一致性,数据操作除了插入和查询之外,还包含很多的更新、删除操作,那么InnoDB存储引擎是比较合适的选择。
  • MyISAM:如果应用是以读操作和插入操作为主只有很少的更新和删除操作,并且对事务的完整性、并发性要求不是那么高,那么选择这个存储引擎是非常合适的。
  • MEMORY:将所有数据保存在内存中,访问速度快,通常用于临时表及缓存。MEMORY的缺陷就是对表的大小有限制,太大的表无法缓存在内存中,而且无法保障数据的安全性。

第二章 索引

  • 索引概述
  • 索引结构
  • 索引分类
  • 索引语法
  • SQL性能分析
  • 索引使用
  • 索引设计原则

一、索引概述

  • 介绍

索引(index)是帮助MySQ==L高效获取数据==的==数据结构(有序)==。在数据结之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。

  • 优缺点

优势

劣势

提高数据检索的效率,降低数据库的IO成本

索引列也是要占用空间的

通过索引对数据进行排序,降低数据排序的成本,降低CPU的消耗

索引大大提高了查询效率,同时也降低更新表的速度,如对表进行insert、update、delete时,效率降低

二、索引结构

MySQL的索引是在存储引擎层实现的,不同的存储引擎有不同的结构,主要包含以下几种:

索引结构

描述

B Tree索引

最常见的索引类型,大部分引擎都支持B 树索引

Hash索引

底层数据结构是用哈希表实现的,只有精确匹配索引列的查询才有效,不支持范围查询

R-tree(空间索引)

空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据结构,通常使用较少

Full-text(全文索引)

是一种通过建立倒排索引,快速匹配文档的方式。类似于Lucene,Solr,ES

索引

InnoDB

MyISAM

Memory

B tree索引

支持

支持

支持

Hash索引

不支持

不支持

支持

R-tree索引

不支持

支持

不支持

Full-text

5.6版本之后支持

支持

不支持

==我们平常所说的索引,如果没有特别指明,都是指B 树结构组织的索引。==

  • B Tree

MySQL索引数据结构对经典的B Tree进行了优化。在原B Tree的基础上,增加 一个指向相邻叶子结点的链表指针,就形成了带有顺序指针的B Tree,提高区 间访问的性能。

  • Hash 哈希索引就是采用一定的hash算法,将键值换算成新的hash值,映射到对应的槽位上,然后存储在hash表中。
    • Hash索引特点
    • 存储引擎支持 在MySQL中,支持hash索引的是Memory引擎,而InnoDB中具有自适应hash功能,hash索引是存储引擎根据B Tree索引在指定条件下自动构建的,
    1. Hash索引只能用于对等比较(=,in),不支持范围查询(between,>,<,...)
    2. 无法利用索引完成排序操作
    3. 查询效率高,通常只需要一次检索就可以了,效率通常高于B tree索引

思考:

为什么InnoDB存储引擎选择使用B tree索引结构?

  • 相对于二叉树,层级更少,搜索效率高
  • 对于B-tree,无论是叶子结点还是非叶子结点,都会保存数据,这样导致一页中存储的键值减少,指针跟着减少,要同样保存大量数据,只能增加树的高度,导致性能降低
  • 相对Hash索引,B tree支持范围匹配及排序操作

三、索引分类

分类

含义

特点

关键字

主键索引

针对于表中主键创建的索引

默认自动创建,只能有一个

PRIMARY

唯一索引

避免同一个表中某数据列中的值重复

可以有多个

UNIQUE

常规索引

快速定位特定数据

可以有多个

全文索引

全文索引查找的是文本中的关键词,而不是比较索引中的值

可以有多个

FULLTEXT

在InnoDB存储引擎中,根据索引的存储形式,又可以分为以下两种:

分类

含义

特点

聚集索引(Clustered Index)

将数据存储与索引放到了一块,索引结构的叶子结点保存了行数据

必须有,而且只有一个

二级索引(Secondary Index)

将数据与索引分开存储,索引结构的叶子结点关联的是对应的主键

可以存在多个

聚集索引选取规则:

  • 如果存在主键,主键索引就是聚集索引
  • 如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引
  • 如果表没有主键,或没有合适的唯一索引,则InnoDB会自动生成一个rowid作为隐藏的聚集索引

四、索引语法

创建索引

代码语言:javascript复制
create [UNIQUE|FULLTEXT] index index_name on table_name (index_col_name,...);

查看索引

代码语言:javascript复制
show index from table_name;

删除索引

代码语言:javascript复制
drop index index_name on table_name;

五、SQL性能分析

  • SQL执行频率 MySQL客户端连接成功后,通过show[session|global] status命令可以提供服务器状态信息。通过如下指令,可以查看当前数据库的insert、update、delete、select的访问频率
  • 慢查询日志 慢查询日志记录了所有执行时间超过指定参数(long_query_time,单位:秒,默认10秒)的所有SQL语句的日志。 MySQL的慢查询日志默认没有开启,需要在MySQL的配置文件(/etc/my.cnf)中配置如下信息:
代码语言:javascript复制
# 开启mysql慢日志查询开关
slow_query_log=1
# 设置慢日志的时间为2秒,sql语句执行时间超过2秒,就会视为慢查询,记录慢查询日志
long_query_time=2
  • profile详情 show profile能够在做SQL优化时帮助我们了解时间都耗费到哪里去了。通过have_profiling参数,能够看到当前MySQL是否支持 profile操作:
代码语言:javascript复制
select @@have_profiling;

默认profiling是关闭的,可以通过set语句在session/global级别开启profiling;

代码语言:javascript复制
set profiling=1;

执行一系列的业务SQL的操作,然后通过如下指令查看指令的执行耗时:

代码语言:javascript复制
# 查看每一条SQL的耗时基本情况
show profiles;

# 查看指定query_id的SQL语句各个阶段的耗时情况
show profile for query query_id;

# 查看指定query_id的SQL语句CPU的使用情况
show profile cpu for query query_id;

explain执行计划

  • id
  • type
  • key
  • rows
  • 执行select查询的序列号,表示查询中执行select子句或者是操作表的顺序(id相同,执行顺序从上到下;id不同,值越大,越先执行)
  • 表示连接类型,性能由好到差的连接类型为null、system、const、eq_ref、ref、range、index、all
  • 实际使用的索引,如果为null,则没有使用索引
  • MySQL认为必须要执行查询的行数,在innodb引擎的表中,是一个估计值,可能并不总是准确的
  • explain执行计划各字段含义:

六、索引使用

验证索引效率

在未建立索引之前,执行如下SQL语句,查看SQL的耗时

代码语言:javascript复制
select * from tb_sku where sn = '1000000003410008';

针对字段创建索引

代码语言:javascript复制
create index idx_sku_sn on tb_sku(sn);

然后再次执行相同的SQL语句,再次查看SQL的耗时

代码语言:javascript复制
select * from tb_sku where sn = '1000000003410008';

最左前缀法则

如果索引了多列(联合索引),要遵守最左前缀法则。最左前缀法则指的是查询从索引的最左列开始,并且不跳过索引中的列。

如果跳跃某一列,==索引将部分失效(后面的字段索引失效)==

范围查询

联合索引中,出现范围查询(>,<),==范围查询右侧的列索引会失效==

索引列运算

不要在索引列上进行运算操作,==索引将失效==

字符串不加引号

字符串类型字段使用时,不加引号,==索引将失效==

模糊查询

如果仅仅是尾部模糊匹配,索引不会失效。如果是头部模糊匹配,索引失效。

or连接的条件

用or分割开的条件,如果or前的条件中的列有索引,而后面的列中没有 索引,那么涉及的索引都不会被用到

数据分布影响

如果MySQL评估使用索引比全表更慢,则不使用索引

SQL提示

SQL提示,是优化数据库的一个重要手段,简单来说,就是在SQL语句中加入一些人为的提示来达到优化操作的目的

代码语言:javascript复制
explain select * from 表名 [use index|ignore index|force index] where 条件;

覆盖索引

尽量使用覆盖索引(查询使用了索引,并且需要返回的列,在该索引中已经全部能够找到),减少select *

前缀索引

当字段类型为字符串(varchar,text等)时,有时候需要索引很长的字符串,这会让索引变得很大,查询时,浪费大量的磁盘IO,影响查询效率。此时可以只将字符串的一部分前缀,建立索引,这样可以大大节约索引空间,从而提高索引效率。

  • 语法 create index idx_xxxx on table_name(column(n));

单列索引与联合索引

  • 单列索引:即一个索引只包含单个列

思考:

一张表,有四个字段(id,username,password,status),由于数据量大,需要对以下SQL语句进行优化,该如何进行才是最优方案:

代码语言:javascript复制
select id,username,password from tb_user where username='ithui';

建立username和password的联合索引

七、索引设计原则

  1. 针对于数据量较大,且查询比较频繁的表建立索引
  2. 正对于常作为查询条件(where)、排序(order by)、分组(group by)操作的字段建立索引
  3. 尽量选择区分度高的列作为索引,尽量建立唯一索引,区分度越高,使用索引的效率越高
  4. 如果是字符串类型的字段,字段的长度较长,可以针对于字段的特点,建立前缀索引
  5. 尽量使用联合索引,减少单列索引,查询时,联合索引很多时候可以覆盖索引,节省存储空间,避免回表,提高查询效率
  6. 要控制索引的数量,索引并不是多多益善,索引越多,维护索引结构的代价也就越大,会影响增删改的效率
  7. 如果索引列不能存储null值,请在创建表时使用not null约束它。当优化器知道每列是否包含null值时,它可以更好地确定哪个索引最有效地用于查询

第三章 SQL优化

  • 插入数据
  • 主键优化
  • order by优化
  • group by优化
  • limit优化
  • count优化
  • update优化

一、插入数据

insert优化

  • 批量插入 # 插入条数在500-1000条 insert into tb_test values(1,'tom'),(2,'cat'),(3,'jerry');
  • 主键顺序插入 主键乱序插入:8 1 9 21 13 12 4 89 7 主键顺序插入:1 2 3 4 5 6 7 8 9

二、主键优化

  • 数据组织方式 在InnoDB存储引擎中,表数据都是根据主键顺序组织存放的,这种存储方式的表成为索引组织表?(index organized table IOT)
  • 页分裂 页可以为空,也可以填充一半,也可以填充100%。每个页面包含了2-N行数据(如果一行数据很大,会行益处),根据主键排列
  • 页合并 当删除一行记录时,实际上记录并没有被物理删除,只是记录被标记(flaged)为删除并且它的空间变得允许被其他记录声明使用。 当页中删除的记录达到MERGE_THRESHOLD(默认为页的50%),InnoDB会开始寻找最靠近的页(前或后)看看是否可以将两个页合并以优化空间使用。
  • 主键设计原则
    • 满足业务需求的情况下,尽量降低主键的长度
    • 插入数据时,尽量选择顺序插入,选择使用AUTO_INCREMENT自增主键
    • 尽量不要使用UUID做主键或者是其他自然主键,如身份证号
    • 业务操作时,避免对主键的修改

三、order by优化

  1. Using filesort:通过表的索引或全表扫描,读取满足条件的数据行,然后在排序缓冲区sort buffer中完成排序操作,所有不是通过所有直接返回排序结果都叫FileSort排序
  2. Using index:通过有序索引顺序扫描直接返回有序数据,这种情况即为using index,不需要额外排序,操作效率高
  • 根据排序字段建立合适的索引,多字段排序时,也遵循最左前缀法则
  • 尽量使用覆盖索引
  • 多字段排序,一个升序一个降序,此时需要注意联合索引在创建时的规则(ASC/DESC)
  • 如果不可避免的出现filesort,大数据量排序时,可以适当增加排序缓冲区大小sort_buffer(默认256k)

四、group by优化

  • 在分组操作时,可以通过索引来提高效率
  • 分组操作时,索引的使用也是满足最左前缀法则的

五、limit优化

一个常见又非常头疼的问题就是limit 20000000,10,此时需要MySQL排序前20000010记录,仅仅返回20000000-20000010的记录,其他记录丢弃,查询拍讯的代价非常大

优化思路:一般分页查询时,通过创建覆盖索引能够比较 好地提高性能,可以通过覆盖索引加子查询形式进行优化

例:

代码语言:javascript复制
explain select * from tb_sku t, (select id from tb_sku order by id limit 2000000,10) a where t.id = a.id;

六、count优化

  • MyISAM引擎把一个表的总行数存在了磁盘上,因此执行count(*)的时候会直接返回这个数,效率很高
  • InnoDB引擎就麻烦了,它执行count(*)的时候,需要把数据一行一行地从引擎里面读出来,然后累积计数

优化思路:自己计数

  • count的几种用法 count()是一个聚合函数,对于返回的结果集,一行行地判断,如果count函数的参数不是NULL,累计值就加1,否则不加,最后返回累计值 用法count(*)、count(主键)、count(字段)、count(1) 按照效率排序的话:count(字段)<count(主键 id)<count(1)=count(字段),所以尽量使用count(*)
    • count(主键) InnoDB引擎会遍历整张表,把每一行的主键id值都取出来,返回给服务层。服务层拿到主键后,直接按行进行累加(主键不可能为null)
    • count(字段) 没有not null约束:InnoDB引擎会遍历整张表把每一行的字段值都取出来,返回给服务层,服务层判断是否为null,不为null,计数累加 有not null约束:InnoDB引擎会遍历整张表把每一行的字段值都取出来,返回给服务层,直接按行进行累加
    • count(1) InnoDB引擎遍历整张表,但不取值。服务层对于返回的每一行,放一个数字“1”进去,直接按行进行累加
    • count(*) InnoDB引擎并不会把全部字段取出来,而是专门做了优化,不取值,服务层直接按行进行累加

七、update优化

InnoDB的行锁是针对索引加的锁,不是针对记录加的锁,并且该索引不能失效,否则会从行锁升级为表锁。

第四章 视图

  • 视图
  • 存储过程
  • 存储函数
  • 触发器

一、视图

  • 介绍

视图(view)是一种虚拟存在的表。视图中的数据并不在数据库中实际存在,行和列数据来自定义视图的查询中使用的表,并且是在使用视图时动态产生的。

创建

代码语言:javascript复制
create [or replace] view 视图名称[(列名列表)] as select 语句 [with[cascaded | local] check option]

查询

代码语言:javascript复制
# 查看创建视图语句
show create view 视图名称;
# 查看视图数据
select * from 视图名称...;

修改

代码语言:javascript复制
# 方式一:
create [or replace] view 视图名称[(列名表名)] as select 语句 [with[cascaded | local] check option]
# 方式二:
alter view 视图名称[(列名列表)] as select 语句 [with[cascaded | local] check option]

删除

代码语言:javascript复制
drop view [if exists] 视图名称 [,视图名称]...

视图的检查选项

当使用with check option子句创建视图时,MySQL会通过视图检查正在更改的每个行,例如插入,更新,删除,以使其故何视图定义。MySQL允许基于另一个视图创建视图,它还会检查依赖视图中的规则以保持一致性。为了确定检查的范围,mysql提供了两个选项:cascaded和local,默认值为cascaded

  • cascaded:

视图更新

要使视图可更新,视图中的行与基础表中的行之间必须存在一对一的关系。如果视图包含以下任何一项,则该视图不可更新:

  • 聚合函数或窗口函数(sum()、min()、max()、count()等)
  • group by
  • union或者union all

作业

  • 作用 视图不仅可以简化用户对数据的理解,也可以简化他们的操作。那些被经常使用的查询可以被定义为视图,从而使得用户不必为以后的操作每次指定全部的条件
  • 数据独立 视图可帮助用户屏蔽真实表结构变化带来的影响

二、存储过程

介绍

存储过程是事先经过编译并存储在数据库中的一段SQL语句的集合,调用存储过程可以简化应用开发人员的很多工作,减少数据在数据库和应用服务器之间的传输,对于提高数据处理的效率是有好处的。

存储过程思想上很简单,就是数据库SQL语言层面的代码封装与重用

特点

封装,复用

可以接收参数,也可以返回数据

减少网络交互,效率提升

创建

代码语言:javascript复制
create procedure 存储过程名称([参数列表])
begin
  --sql语句
end;

调用

代码语言:javascript复制
call 名称([参数]);

查看

代码语言:javascript复制
select * from information_schema.routines where routine_schema='xxx';--查询指定数据的存储过程及状态信息
show create procedure 存储过程名称;--查询某个存储过程的定义

删除

代码语言:javascript复制
drop procedure [if exists] 存储过程名称;

==注意:在命令行中,执行创建存储过程的SQL时,需要通过关键字delimiter指定SQL语句的结束。==

变量

==系统变量==是MySQL服务器提供,不是用户自定义的,属于服务器层面。分为全局变量(==GLOBAL==)、会话变量(==SESSION==)。

==用户自定义变量==是用户根据需要自己定义的变量,用户变量不用提前声明,在用的时候直接用“@变量名”使用就可以。其作用域为当前连接。

==局部变量==是根据需要定义的在局部生效的变量,访问之前,需要declare声明。可用作存储过程内的局部变量和输入参数,局部变量的范围是在其内声明的begin...end块。

  • 声明 declare 变量名 变量类型[default ...]; 变量类型就是数据库字段类型:int、bigint、char、varchar、date、time等
  • 赋值 set @var_name=expr[,@var_name=expr]...; set @var_name:=expr[,@var_name:=expr]...; select @var_name:=expr[,@var_name:=expr]...; select 字段名 into @var_name from 表名;
  • 查看系统变量 show [session|global] variables;--查看所有系统变量 show [session|global] variables like '...'--可以通过like模糊匹配方式查找变量 select @@[session|global] 系统变量名;--查看指定变量的值

if

语法:

代码语言:javascript复制
if 条件1 then
  ...
elseif 条件2 then --可选
  ...
else --可选
  ...
end if;

参数

类型

含义

备注

in

该类参数作为输入,也就是需要调用时传入值

默认

out

该类参数作为输出,也就是该参数可以作为返回值

inout

既可以作为输入参数,也可以作为输出参数

case

  • 语法一 case case_value when when_value1 then statement_list1 [when when_value2 then statement_list2]... [else statement_list] end case;

while

while循环是有条件的循环控制语句。满足条件后,再执行循环体中的SQL语句。具体语法为:

代码语言:javascript复制
#先判定条件,如果条件为true,则执行逻辑,否则,不执行逻辑
where 条件 do
 SQL逻辑...
end while;

repeat

repeat是有条件的循环控制语句,当满足条件的时候退出循环。具体语法为:

代码语言:javascript复制
repeat
 SQL逻辑...
 until 条件
end repeat;

loop

loop实现简单的循环,如果不在SQL逻辑中增加退出循环的条件,可以用其来实现简单的死循环。loop可以配合一下两个语句使用:

代码语言:javascript复制
[begin_label:] loop
 SQL逻辑...
end loop [end_label];
代码语言:javascript复制
leave label;--退出指定标记的循环体
iterate label;--直接进入下一次循环
  • leave:配合循环使用,退出循环。

游标

游标是用来存储查询结果集的数据类型,在存储过程和函数中可以使用优表对结果集进行循环的处理。游标的使用包括游标的声明、open、fetch和close,其语法分别如下

  • 声明游标 declare 游标名称 cursor for 查询语句;
  • 获取游标记录 fetch 游标名称 into 变量[,变量];

条件处理程序

条件处理程序可以用来定义在流程控制结构执行过程中遇到问题时相对应的处理步骤。具体语法为:

代码语言:javascript复制
declare handler_action handler for condition_value [,condition_value]... statement;

handler_action
 continue:继续执行当前程序
 exit:终止执行当前程序
condition_value
 sqlstate sqlstate_value:状态码,如02000
 sqlwarning:所有以01开头的sqlstate代码的简写
 not found:所有以02开头的sqlstate代码的简写
 sqlexception:所有没有被sqlwarning或not found捕获的sqlstate代码的简写

三、存储函数

存储函数是有返回值的存储过程,存储函数的参数只能是in类型的。具体语法如下:

代码语言:javascript复制
create function 存储函数名称([参数列表])
returns type [characteristic...]
begin
 --sql语句
 return...;
end;

characteristic说明:
- determinstic:相同的输入参数总是产生相同的结果
- no sql:不包含sql语句
- reads sql data:包含读取数据的语句,但不包含写入数据的语句

四、触发器

  • 介绍 触发器是与表有关的数据库对象,指在insert/update/delete之前或之后,触发并执行触发器中定义的SQL语句集合。触发器的这种特性可以协助应用在数据库端确保数据的完整性,日志记录,数据校验等操作。 使用别名OLD和NEW来引用触发器中发生变化的记录内容,这与其他的数据库是相似的。现在触发器还只支持行级触发,不支持语句级触发。

触发器类型

new和old

insert型触发器

new表示将要或者已经新增的数据

update型触发器

old表示修改之前的数据,new表示将要或已经修改后的数据

delete型触发器

old表示将要或者已经删除的数据

语法

  • 创建 create trigger trigger_name before/after insert/update/delete on tbl_name for each row --行级触发器 begin trigger_stmt; end;
  • 删除 drop trigger [schema_name]trigger_name; 如果没有指定schema_name,默认为当前数据库

第五章 锁

  • 概述
  • 全局锁
  • 表级锁
  • 行级锁

一、概述

  • 介绍 锁是计算机协调多个进程或线程并发访问某一资源的机制。在数据库中,除传统的计算机资源(CPU、RAM、I/O)的争用之外,数据也是一种供许多用户共享的资源。如何保证数据并发访问的一致性、有效性是所有数据库必须解决的一个问题,锁冲突也是影响数据库并发访问性能的一个重要因素。从这个角度来说,锁对数据库而言显得尤其重要,也更加复杂。
  • 分类
    1. 全局锁:锁定数据库中的所有表
    2. 表级锁:每次操作锁住整张表
    3. 行级锁:每次操作锁住对应的行数据

二、全局锁

介绍

全局锁就是对整个数据库实例加锁,加锁后整个实例就处于只读状态,后续的DML的写语句,DDL语句,已经更新操作的事务提交语句都将被阻塞。

其典型的使用场景是做全裤的逻辑备份,对所有的表进行锁定,从而获取一致性视图,保证数据的完整性。

演示

特点

数据库中加全局锁,是一个比较重的操作,存在一下问题:

1、如果在主库上备份,那么在备份期间都不能执行更新,业务基本上就得停摆

2、如果在从库上备份,那么在备份期间从库不能执行主库同步过来的二进制日志(binlog),会导致主从延迟

在InnoDB引擎中,我们可用在备份时加行参数--single-transaction参数来完成不加锁的一致性数据备份

代码语言:javascript复制
mysqldump --single-transaction -uroot -pLI1944575687 itcast > itcast.sql

三、表级锁

表级锁,每次操作锁住整张表。锁定粒度大,发生锁冲突的概率最高,并发度最低。应用在MyISAM、InnoDB、BDB等存储引擎中

对于表级锁,主要分为以下三类:

  1. 表锁
  2. 元数据锁(meta data lock,MDL)
  3. 意向锁

表锁

对于表锁,分为两类:

语法:

==读锁不会阻塞其他客户端的读,但是会阻塞写。写锁即会阻塞其他客户端的读,又会阻塞其他客户端的写==

  • 加锁:lock tables 表名... read/write
  • 表共享读锁(read lock)

元数据锁(meta data lock,MDL)

MDL加锁过程是系统自动控制,无需显示使用,在访问一张表的时候会自动加上。MDL锁主要作用是维护表元数据的数据一致性,在表上有活动事务的时候 ,不可以对元数据进行写入操作。

在MySQL5.5中引入了MDL,当对一张表进行增删改查的时候,加MDL读锁(共享);当对表结构进行变更操作的时候,加MDL写锁(排他)

对应SQL

锁类型

说明

lock tables xxx read/write

SHARED_READ_ONLY / SHARED_NO_READ_WRITE

select、select...lock in share mode

SHARED_READ

与SHARED_READ、SHARED_WRITE兼容,与EXCLUSIVE互斥

Insert、update、delete、select...for update

SHARED_WRITE

与SHARED_READ、SHARED_WRITE兼容,与EXCLUSIVE互斥

alter table...

EXCLUSIVE

与其他的MDL都互斥

查看元数据锁:

代码语言:javascript复制
select object_type,object_schema,object_name,lock_type,lock_duration from performance_schema.metadata_locks;

意向锁

为了避免DML在执行时,加的行锁与表锁的冲突,在InnoDB中引入了意向锁,使得表锁不用检查每行数据是否加锁,使用意向锁来减少表锁的检查

可以通过以下SQL,查看意向锁及行锁的加锁情况:

代码语言:javascript复制
select object_schema,object_name,index_name,lock_mode,lock_data from performance_schema.data_locks;
  • 意向共享锁(IS):由语句select...lock in share mode添加。与表锁共享锁(read)兼容,与表锁排他锁(write)互斥

四、行级锁

介绍

行级锁,每次擦欧总锁住对应的行数据。锁定粒度最小,发生锁冲突的概率最低,并发度最高。应用子InnoDB存储引擎中

InnoDB的数据是基于索引组织的,行锁是通过对索引上的索引项加锁来实现的,而不是对记录加的锁。对于行级锁,主要分为以下三类:

  • 行锁(Record Lock):锁定耽搁行记录的锁,防止其他事务对此进行update和delete。在RC、RR隔离级别下都支持
  • 临键锁(Next-Key Lock):行锁和间隙锁组合,同时锁住数据,并锁住数据前面的间隙Gap。在RR隔离级别下支持

行锁

InnoDB实现了以下两种类型的行锁:

S(共享锁)

X(排他锁)

S(共享锁)

兼容

冲突

X(排他锁)

冲突

冲突

SQL

行锁类型

说明

insert...

排他锁

自动级锁

update...

排他锁

自动加锁

delete...

排他锁

自动加锁

select(正常)

不加任何锁

select...lock in share mode

共享锁

需要手动在select之后加lock in share mode

select...for update

排他锁

需要手动在select之后加for update

  • 共享锁(S):允许一个事物去读一行,阻止其他事务获得相同数据集的排他锁

行锁-演示

默认情况下,InnoDB在REPEATABLE READ事务隔离级别运行,InnoDB使用next-key锁进行搜索和索引扫描,以防止幻读。

可以通过以下SQL,查看意向锁及行锁的加锁情况:

代码语言:javascript复制
select object_schema,object_name,index_name,lock_type,lock_mode,lock_data from performance_schema.data_locks;
  • 针对唯一索引进行检索时,对已存在的记录进行等值匹配时,将会自动优化为行锁

间隙锁/临键锁-演示

默认情况下,InnoDB在REPEATABLE READ事务隔离级别运行,InnoDB使用next-key锁进行搜索和索引扫描,以防止幻读。

注意:间隙锁唯一目的是防止其他事务插入间隙。间隙锁可以共存,一个事务采用的间隙锁不会阻止另一个事务在同一间隙上采用间隙锁

  • 索引上的等值查询(唯一索引),给不存在的记录加锁时,优化为间隙锁
  • 索引上的范围查询(唯一索引)--会访问倒不满足条件的第一个值为止

第六章 InnoDB引擎

  • 逻辑存储结构
  • 架构
  • 事务原理
  • MVCC

一、逻辑存储结构

  • 表空间(ibd文件),一个mysql实例可以对应多个表空间,用于存储记录、索引等数据。
  • 段,分为数据段(Leaf node segment)、索引段(Non-leaf node segment)、回滚段(Rollback segment),InnoDB是索引组织表,数据段就是B 树的叶子结点,索引段即为B 树的非叶子结点。段用来管理多个Extent(区)。
  • 区,表空间的单元结构,每个区的大小为1M。默认情况下,InnoDB存储引擎页大小为16K,即一个区中一共有64个连续的页。
  • 页,是InnoDB存储引擎磁盘管理的最小单元,每个页的大小默认为16KB。为了保证页的连续性,InnoDB存储引擎每次从磁盘申请4-5个区。
  • 行,InnoDB存储引擎数据是按行进行存放的。
    • Trx_id:每次对某条记录进行改动时,都会把对应的事务id赋值给trx_id隐藏列
    • Roll_pointer:每次对某条记录进行改动时,都会把旧的版本写入到undo日志中,然后这个隐藏列就相当于一个指针,可以通过它来找到该记录修改前的 信息

二、架构

MySQL5.5版本开始,默认使用InnoDB存储引擎,它擅长事务处理,具有崩溃恢复特性,在日常开发中使用非常广泛。下面是InnoDB架构图,右侧为磁盘结构。

架构-内存结构
  • Buffer Pool:缓冲池是主内存中的一个区域,里面可以缓存磁盘上经常操作的真实数据,在执行增删改查操作时,先操作缓冲池中的数据(若缓冲池没有数据,则从磁盘加载并缓存),然后再以一定频率刷新到磁盘,从而减少磁盘IO,加快处理速度。
  • 缓冲池以Page页为单位,底层采用链表数据结构管理Page。根据状态,将Page分为三种类型:
    • free page:空闲page,未被使用
    • clean page:被使用page,数据没有被修改过
    • dirty page:脏页,被使用page,数据被修改过,页中数据与磁盘的数据产生了不一致。
  • Change Buffer:更改缓冲区(针对于非唯一二级索引页),在执行DML语句时,如果这些数据Page没有在Buffer Pool中,不会直接操作磁盘,而会将数据变更存在更改缓冲区Change Buffer中,在未来数据被读取时,再将数据合并恢复到Buffer Pool中,再将合并后的数据刷新到磁盘中
    • Change Buffer的意义是什么? 与聚集索引不同,二级索引通常是非唯一的,并且以相对随机的顺序插入二级索引。同样,删除和更新可能会影响索引树中不相邻的二级索引页,如果每一次都操作磁盘,会造成大量的磁盘IO。有了Change Buffer之后,我们可以在缓冲池中进行合并处理,减少磁盘IO。
  • Adaptive Hash Index:自适应hash索引,用于优化对Buffer Pool数据的查询。InnoDB存储会监控对表上各索引页的查询,如果观察到hash索引可以提升速度,则建立hash索引,称之为自适应hash索引。 ==自适应哈希索引,无需人工干涉,是系统根据情况自动完成== 参数:adaptive_hash_index
  • Log Buffer:日志缓冲区,用来保存要写入磁盘中的log日志数据(redo log、undo log),默认大小为16MB,日志缓冲区的日志会定期刷新到磁盘中。如果需要更新、插入或删除许多行的事务,增加日志缓冲区的大小可以节省磁盘I/O 参数: innodb_log_buffer_size:缓冲区大小 innodb_flush_log_at_trx_commit:日志刷新到磁盘时机
    • 1:日志在每次事务提交时写入并刷新到磁盘
    • 0:每秒将日志写入并刷新到磁盘一次
    • 2:日志在每次事务提交后写入,并美妙刷新到磁盘一次
架构-磁盘架构
  • System Tablespace:系统表空间是更改缓冲区的存储区域。如果表是在系统表空间而不是每个表文件或通用表空间中创造的,它也可能包含表和索引数据。(在MySQL5.x版本中还包含InnoDB数据字典、undolog等) 参数:innodb_data_file_path
  • File-Per-Table Tablespaces:每个表的文件表空间包含单个InnoDB表的数据和索引,并存储在文件系统上的单个数据文件中。 参数:innodb_file_per_table
  • General Tablespaces:通用表空间,需要通过create tablespace语法创建通用表空间,在创建表时,可以指定该表空间
  • Undo Tablespaces:撤销表空间,MySQL实例在初始化时会自动创建两个默认的undo表空间(初始大小16M),用于存储undo log日志
  • Temporary Tablespaces:InnoDB使用会话临时表空间和全局临时表空间。存储用户创建的临时表等数据
  • Doublewrite Buffer Files:双写缓冲区,innoDB引擎将数据页从Buffer Pool刷新到磁盘前,先将数据页写入双写缓冲区文件中,便于系统异常时恢复数据
    • ib_16384_0.dblwr
    • ib_16384_1.dblwr
  • Redo Log:重做日志,是用来实现事务的持久性。该日志文件由两部分组成:重做日志缓冲(redo log buffer)以及重做日志文件(redo log),前者是在内存中,后者是在磁盘中。当事务提交之后会把所有修改信息都会存到该日志中,用于在刷新脏页到磁盘时,发生错误时,进行数据恢复使用
架构-后台线程
  1. Master Thread 核心后台线程,负责调度其他线程,还负责将缓冲池中的数据异步刷新到磁盘中,保持数据的一致性,还包括脏页的刷新、合并插入缓存、undo页的回收
  2. IO Thread 在InnoDB存储引擎中大量使用了AIO来处理IO请求,这样可以极大地提高数据库的性能,而IO Thread主要负责这些IO请求的回调 线程类型默认个数职责Read thread4负责度操作Write thread4负责写操作Log thread1负责将日志缓冲区刷新到磁盘Insert buffer thread1负责将写缓冲区内容刷新到磁盘
  3. Purge Thread 主要用于回收事务已经提交了的undo log,在事务提交之后,undo log可能不用了,就用它来回收
  4. Page Cleaner Thread 协助Master Thread刷新脏页到磁盘的线程,它可以减轻Master Thread的工作压力,减少阻塞

三、事务原理

  • 事务 事务是一组操作的集合,它是一个不可分割工作单位,事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败
  • 特性
    • 原子性(Atomicity):事务是不可分割额最小操作单元,要么全部成功,要么全部失败
    • 一致性(Consistency):事务完成时,必须使所有的数据都保持一致状态
    • 隔离线(Isolation):数据库系统提供的隔离机制,保证事务在不受外部并发操作影响的独立环境下运行
    • 持久性(Durability):事务一旦提交或回滚,它对数据库中方的数据的改变就是永久的
  • redo log 重做日志,记录的是事务提交时数据页的物理修改,是用来实现事务的持久性。该日志文件由两部分组成:重做日志缓冲(redo log buffer)以及重做日志文件(redo log file),前者是在内存中,后者是在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中,用于在刷新脏页到磁盘,发生错误时,进行数据恢复使用
  • undo log 回滚日志,用于记录数据被修改前的信息,作用包含两个:提供回滚和MVCC(多版本并发控制) undo log和redo log记录物理日志不一样,它是逻辑日志。可以认为当delete一条记录时,undo log中会记录一条对应的insert记录,反之亦然,当update一条记录时,它记录一条对应相反的update记录。当执行rollback时,就可以从undo log中的逻辑记录读取到相应的内容并进行回滚。 Undo log销毁:undo log 在事务执行时产生,事务提交时,并不会立即删除undo log,因为这些日志可能还用于MVCC Undo log存储:undo log采用段的方式进行管理和记录,存放在前面介绍的rollback segment回滚段中,内部包含1024个undo log segment

四、MVCC

MVCC-基本概念
  • 当前读 读取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁。对于我们日常的操作,如:select...lock in share mode(共享锁),select...for update、update、insert、delete(排他锁)都是一种当前读
  • 快照读 简单的select(不加锁)就是快照读,读取的是记录数据的可见版本,有可能是历史数据,不加锁,是非阻塞读。
    • Read Committed:每次select,都生成一个快照读
    • Repeatable Read:开启事务后第一个select语句才是快照读的地方
    • Serializable:快照读会退化为当前读
  • MVCC 全称Multi-Version Concurrency Control,多版本并发控制。指维护一个数据的多个版本,使得读写操作没有冲突,快照读为MySQL实现MVCC提供了一个非阻塞读功能。MVCC的具体实现,还需要依赖于数据库记录中的三个隐式字段、undo log日志、readView
MVCC-实现原理
  • 记录中的隐藏字段

隐藏字段含义DB_TRX_ID最近修改事务ID,记录插入这条记录或者最后一次修改该记录的事务IDDB_ROLL_PTR回滚指针,指向这条记录的上一个版本,用于配合undo log,指向上一个版本DB_ROW_ID隐藏主键,如果表结构没有指定主键,将会生成该隐藏字段

  • undo log 回滚日志,在insert、update、delete的时候产生的便于数据回滚的日志 在insert的时候,产生的undo log日志只在回滚时需要,在事务提交后,可被立即删除 而update、delete的时候,产生的undo log日志不仅在回滚时需要,在快照读时也需要,不会立即被删除
  • undo log版本链

不同事务或相同事务对同一条记录进行修改,会导致该记录的undo log生成一条记录版本链表,链表的头部时最新的旧记录,链表尾部时最早的旧记录

  • readView ReadView(读视图)是==快照读==SQL执行时MVCC提取数据的依据,记录并维护系统当前活跃的事务(未提交的)id。 ReadView中包含了四个核心字段: 字段含义m_ids当前活跃的事务ID集合min_trx_id最小活页事务IDmax_trx_id预分配事务ID,当前最大事务ID 1(因为事务ID是自增的)creator_trx_idReadView创建者的事务ID

不同的隔离级别,生产ReadView的时机不同:

  • READ COMMITTED:在事务中每一次执行快照读时生成ReadView
  • REPEATABLE READ:仅在事务中第一次执行快照读时生成ReadView,后续复用该ReadView

第七章 MySQL管理

  • 系统数据库
  • 常用工具

一、系统数据库

MySQL数据库安装完成后,自带了以下四个数据库,具体作用如下:

数据库

含义

mysql

存储MySQL服务器正常运行所需要的各种信息(时区、主从、用户、权限等)

information_schema

提供了访问数据库元数据的各种表和视图,包含数据库、表、字段类型及访问权限等

performance_schema

为MySQL服务器运行时状态提供了一个底层监控功能,主要用于收集数据库服务器性能参数

sys

包含了一系列方便DBA和开发人员利用performance_schema性能数据库进行性能调优和诊断的视图

二、常用工具

mysql

该mysql不指mysql服务,而是指mysql的客户端工具

代码语言:javascript复制
语法:
  mysql [options] [database]
选项:
  -u,--uert=name    #指定用户名
  -p,--password[=name]  #指定密码
  -h,--host=name    #指定服务器IP或域名
  -p,--port=port    #指定连接端口
  -e,--execute=name   #执行SQL语句并退出

-e选项可以在MySQL客户端执行SQL语句,而不用连接到MySQL数据库再执行,对于一些批处理脚本,这种方式尤其方便

代码语言:javascript复制
示例:
  mysql -urrot -p123456 db01 -e "select * from stu";

mysqladmin

mysqladmin是一个执行管理操作的客户端程序,可以用它来检查服务器的配置和当前的状态、创建并删除数据库等。

代码语言:javascript复制
通过帮助文档查看选项:
  mysqladmin --help
示例:
  mysqladmin -uroot -p12345 drop 'test01';
  mysqladmin -uroot -p12345 version;

mysqlbinlog

由于服务器生成的二进制日志文件以二进制格式保存,所以如果想要检查这些文本的文本格式,就会使用到mysqlbinlog日志管理工具

代码语言:javascript复制
语法:
  mysqlbinlog [options] log-files1 log-files2...
选项:
  -d,--database=name  #指定数据库名称,只列出指定的数据库相关操作
  -o,--offset=#     #忽略掉日志中的前n行命令
  -r,--result-file=name #将输出的文本格式日志输出到指定文件
  -s,--short-form    #显示简单格式,省略掉一些信息
  --start-datatime=date1 --stop-datetime=date2 #指定日期间隔内的所有日志
  --start-position=pos1 --stop-position=pos2  #指定位置间隔内的所有日志

mysqlshow

mysqlshow客户端对象查找工具,用来很快地查找存在哪些数据库、数据库中的表、表中的列或者索引

代码语言:javascript复制
语法:
  mysqlshow [options] [db_name[table_name[col_name]]]
  
选项:
  -count  #显示数据库及表的统计信息(数据库,表均可以不指定)
  -i    #显示指定数据库或者指定表的状态信息
  
示例:
  #查询每个数据库的表的数量及表中记录的数量
  mysqlshow -uroot -p123 --count
  
  #查询test库中每个表中的字段数,及行数
  mysqlshow -uroot -p123 test --count
  
  #查询test哭中book表的详细情况
  mysqlshow -uroot -p123 test book --count

mysqldump

mysqldump客户端工具用来备份数据或在不同数据库之间进行数据迁移。备份内容包含创建表,及插入表的SQL语句

代码语言:javascript复制
语法:
  mysqldump [options] db_name[tables]
  mysqldump [options] --database/ -B db1[db2 db3..]
  mysqldump [options] --all -databases/-A
连接选项:
  -u,--user=name  #指定用户名
  -p,--password[=name]  #指定密码
  -h,--host=name  #指定服务器ip或域名
  -p,port=#   #指定连接端口
输出选项:
  --add-drop-database  #在每个数据库创建语句前加上drop database语句
  --add-drop-table   #在每个表创建语句前加上drop table语句,默认开启;不开启(--skip-add-drop-table)
  -n,--no-create-db   #不包含数据库的创建语句
  -t,--no-create-info  #不包含数据表的创建语句
  -d,--no-data     #不包含数据
  -T,--tab=name     #自动生成两个文件:一个.sql文件,创建表结构的语句;一个.txt文件,数据文件

mysqlimport/source

mysqlimport是客户端数据导入工具,用来导入mysqldump加- T参数后导出的文本文件

代码语言:javascript复制
语法:
  mysqlimport [options] db_name textfile1 [textfile2...]
示例:
  mysqlimport -uroot -p1234 test /tmp/city.txt

如果需要导入sql文件,可以使用mysql中的source指令:

代码语言:javascript复制
语法:
  source/root/xxx.sql

0 人点赞