(建议收藏)如何处理 openGauss 上遇到的慢 SQL

2022-12-07 14:19:15 浏览数 (1)

大家好,我是 JiekeXu,很高兴又和大家见面了,今天和大家一起来学习在 openGauss 上遇到慢 SQL 该怎么办?

在数据库的日常使用中,难免会遇到慢 SQL,遇到慢 SQL 本身并不可怕,困难之处在于如何识别慢 SQL 并对其优化,使它不至于拖慢整个系统的性能,避免危害到日常业务的正常进行

对不同的数据库来说,由于其系统架构的差异、代码实现的不同,很多慢 SQL 解决“套路”往往是无法直接复用的。为此,我们梳理了在 openGauss 上进行慢 SQL分析的经验,并总结了下来,希望能给 openGauss 的用户一些启发。openGauss 的数据库自治运维系统 DBMind 也已经初步具备了慢 SQL 根因分析的能力,感兴趣的读者也可以尝试一下。

首先,我们可以通过设置 GUC 参数 log_min_duration_statement 来指定 openGauss 系统监控的慢 SQL 阈值。同时,我们也应调大 instr_unique_sql_count 的数值,以免出现“missing SQL statement, GUC instr_unique_sql_count is too small.”的提示。这里以设置慢 SQL 检测阈值为 5 秒(默认数值单位是毫秒)为例:

代码语言:javascript复制
gs_guc reload-D $PGDATA-c'log_min_duration_statement = 5000'-c'instr_unique_sql_count = 2000'

然后执行一个慢 SQL,可以在 dbe_perf.statement_history 视图中查看到结果:

代码语言:javascript复制
selectpg_sleep(6);-- 构造的慢SQL
select * from dbe_perf.statement_history order by start_time desc;

有了上述方法,我们就可以轻易在 openGauss 数据库中监控到慢 SQL 了,接下来可以通过下文的方法来分析慢 SQL 的产生原因。

索引原因导致的慢 SQL

由索引原因引起的慢 SQL 在绝大多数数据库系统中都是十分常见的,甚至可以列为第一大慢 SQL 问题来源。简单来说,大致存在以下几种情况:

1. 缺乏有效索引

2. 执行计划没有选择索引扫描,即索引失效

3.冗余索引

缺乏有效索引

对于缺乏有效索引的场景,在解决问题时,可以先从 SQL 语句本身入手,绝大多数此类 SQL 语句都是 SELECT 语句,且该类 SQL 语句涉及到的表数据量较多,且谓词上没有创建索引,导致数据库系统需要通过全盘扫描来获取数据。对于该情况,一般的做法往往比较“暴力”,即直接在 WHERE 子句、JOIN 子句等涉及到的字段上创建索引。一般存在于 WHERE 子句中的简单比较都是可以使用索引扫描的,因此在该涉及到的字段上创建索引可能是有效的。但是,索引也并非是创建得越多越好(后面我们会提到冗余索引的情况),在创建索引时需要在选择度较高、数据量不是特别少的字段上创建索引,否则该索引收益不大。

对于单语句的索引推荐,openGauss 数据库已经内置了该功能,用户可以通过调用系统函数 gs_index_advise() 进行推荐,例如:

代码语言:javascript复制
select * from gs_index_advise('select * from t1 where a > 1');

单语句索引推荐的核心逻辑可以表示为:

1. 提取 JOIN 类算子中的连接条件,保存为连接关系;

2. 提取 Filter 类算子中的过滤条件,保存为过滤关系;

3. 分析过滤关系中涉及字段的选择度和数据量,将评估适合创建索引的字段加入到候选索引列表中;

4. 分析连接关系,根据表的结果集大小确定驱动表,根据连接关系,将被驱动表中涉及的字段加入到候选索引列表中;

5. 提取 Aggregate 类算子涉及的字段,将该字段加入到候选索引列表中;

6. 提取 Sort 算子涉及的字段,将该字段加入到候选索引列表中;

7. 评估候选索引列表中的全部字段,过滤重复索引,合并相关索引;

8. 输出最终索引推荐的结果。

对于推荐出来的候选索引,用户可以自行决策是否创建,也可以通过 openGauss 的虚拟索引功能来评估索引收益,进行辅助决策。

对于单语句的索引推荐,业内也有不少开源的工具。不过,该类工具多数基于 MySQL 数据库实现(如美团开源的 SQL Advisor)。同时,在索引推荐的层次上,该类工具使用的是对 SQL 语句进行语法解析后的结果,即根据 SQL 语句的抽象语法树Abstract Syntax Tree, AST)进行索引推荐。然而,openGauss 的索引推荐功能还可以建立在查询解析之后的查询树(Query Tree)的基础上进行索引推荐,也就是说,openGaus 的索引推荐是建立在算子粒度上的。这样,某些被优化器改写的 SQL 语句(如exists, in 子查询),也可以被轻易地捕获并进行索引推荐,而前文提到的基于 AST 进行索引推荐的工具是很难实现的。

索引失效

就索引失效而言,一般存在以下六种情况:

1. 联合索引(又叫复合索引、多列索引)的最左匹配原则失效:同 MySQL 类似,openGauss 的联合索引也满足最左匹配原则,如果查询不满足最左匹配原则,数据库优化器会倾向于放弃选择该索引扫描;

2. 使用了SELECT *: 除了老生常谈的可能扫描到不需要的字段之外,使用该写法还有可能导致 openGauss 的 IndexOnlyScan 失效(在MySQL中称为 CoveringIndex),也可能导致索引扫描后进行不必要的回表;

3. 谓词中的索引列参与了运算:这个问题一般不会出现在 openGauss 数据库中,这是因为 openGauss 的 rewrite 过程可以将该写法进行改写。但是 openGauss 的 rewrite 过程是基于规则进行的,某些情况下会存在改写匹配不上的情况,例如把 WHERE 子句的中谓词变得复杂一点就可能出现改写失效,进而导致索引失效,例如 select a from t1 where b - 0 > 1 and c < 100; 语句中的减 0 与否会产生两种截然不同的执行计划;

4. 索引列涉及函数计算:对于 openGauss 来说,函数计算结果往往是“不可预测”的,故该索引有可能是失效的;不过 openGauss 支持函数索引(Functional Index),对于必须在字段上执行函数的情况可以选择使用该索引,只不过该索引的维护代价会比较大;同时,如果定义的函数可以被 rewrite 过程改写,该索引仍然可能是有效的,这点可能与某些数据库的行为不同;

5. 谓词中使用 like: 对于字符串类型(如 varchar, text)的字段,在使用 like 进行模糊查询时,在 openGauss 中默认是不走索引的,这点与 MySQL 在默认情况下不太一致;openGauss 对字符串类型的字段,一般在进行等值查询时会选择使用索引,如果对于该字段更多地进行模糊查询(如 like 或正则),则需要在创建索引时显式地添加 text_pattern_ops 参数,如 create index on movies (title text_pattern_ops); 同时,同MySQL 等数据库一样,该 B Tree 索引也只仅支持前缀匹配查询,如果希望利用 B Tree 进行后缀匹配,可以使用字符串翻转小技巧;对于全文检索,可以使用 openGauss 支持的 tsquery 特性,并通过创建 GIN 或 GiST 索引加速查询;

6. SQL 语义上不应走索引:这种情况的类型有很多,比较典型的是谓词中对同一张表的两列进行比较、不等值比较(如!=, not in, not exists, is not null)、全量排序、类型转换(如字段的类型是 varchar, 在谓词中与 bigint 进行比较时发生了隐式转换)等。

冗余索引

上面我们提到了创建索引的一般情况,对于绝大多数慢 SQL 场景,创建一个合适的索引就可以使得性能突飞猛进。但是,索引是不是就可以越多越好呢?显然不是。我们日常创建的索引中,使用最多的是 B Tree 索引,因此我们以 B Tree 为例,简单解释一下缘由。

众所周知,B Tree 是一个多叉树,它的每一个子节点都是父节点的一个子“范围”。记录(或记录的位置)最终存储在 B Tree 的叶子节点中。因此,在进行数据检索时,只需要扫描匹配的子节点中的指定“范围”即可。但是,对于数据的删除,也需要付出相同的时间开销,进行 B Tree 节点的调整;如果被索引的数据修改了,还需要调整 B Tree 中原有的节点结构。由于 B Tree 的插入、删除、检索的算法时间复杂度都是相同的,因此当业务系统中的插入和删除操作更多时,索引维护的代价就会更大,甚至超过索引检索时带来的收益。与此同时,索引页也需要占用额外的磁盘空间,被索引数据量越大,索引页占据的空间就越大。而且,当前 openGauss 中的 B Tree 的实现仍然是有锁的,更多的索引页面有可能涉及更多的锁维护操作。

在 openGauss 数据库中,可以通过下述语句简单识别没有被使用过的索引:

代码语言:javascript复制
SELECT s.schemaname,
       s.relname AS tablename,
       s.indexrelname AS indexname,
       pg_relation_size(s.indexrelid) AS index_size
FROM pg_catalog.pg_stat_user_indexes s
   JOIN pg_catalog.pg_index i ON s.indexrelid = i.indexrelid
WHERE s.idx_scan = 0      -- has never been scanned
  AND 0 <>ALL (i.indkey)  
  AND NOT i.indisunique   
  AND NOT EXISTS       
         (SELECT 1 FROM pg_catalog.pg_constraint c
          WHERE c.conindid = s.indexrelid)
ORDER BY pg_relation_size(s.indexrelid) DESC;

可以修改上述 SQL 语句中的 idx_scan 条件中的阈值,来调整返回结果。

对于 workload 中全量 SQL 语句进行索引创建其实是非常困难的,因为需要权衡全量 SQL 中增删查改语句的占比情况,同时需要估计索引的检索收益和维护代价,这个权衡过程十分复杂,一般的人工操作其实是很难的。因此,在日常数据库使用中,当需要创建索引时,最好进行全局业务的评估,衡量是否会干扰到其他业务,以及创建的总体收益是否为正,以免后期难以维护。

不过,对于 openGauss 数据库来说,可以使用系统级别的索引推荐功能来解决上述痛点问题,可以通过下述命令查看使用说明:

代码语言:javascript复制
gs_dbmind component index_advisor--help

系统配置原因导致的慢 SQL

在系统配置中,最常见的配置项就是对资源的配置。这包括允许使用的最大资源(主要是内存)、以及资源的使用方式等。除了调整资源配置,有些情况下还需要配置数据库优化器 Cost Model 的代价值。下面我们重点看几个会影响 SQL 语句成为慢 SQL 的系统参数:

max_process_memory: 该参数与 enable_memory_limit 配合使用,用于限制一个 openGauss 实例可用的最大内存。需要将该参数值与宿主机系统的内存总量进行匹配,将宿主机用于操作系统正常运行所需的内存刨除后,剩下的内存空间就可以尽可能多地划分给 openGauss实 例使用了。否则,openGauss 为了避免造成 OOM 问题,会通过该参数限制数据库允许使用的最大内存。因此,如果在客户端或者日志中出现类似“memory usage reach the max_dynamic_memory”的报错时,一般是由于该参数值太小导致的。

shared_buffers:数据库系统使用的缓存池大小。一般来说,综合来看对数据库影响最大的参数就是它了,因为如果该参数设置得过小,会导致缓存不足,从而产生大量的磁盘 I/O. 该参数在 openGauss上 的默认值很小,只有 32MB,对于绝大多数的生产场景是不够的。一般的经验值是设置为系统内存的 25%, 甚至在某些场景中还可以再大一点。不过 openGauss 的 buffer 没有通过 DirectIO 实现,仍然使用了系统缓存(cache),所以一般认为超过系统内存的 40% 也起不到再好的效果了。与此同时,checkpoint_segments 参数也需要随着 shared_buffers 的调大跟着变大一些。

work_mem:显式指定内排序和哈希表能使用的内存空间大小,如果该值设得比较小,会向磁盘写入更多的临时文件。因此,我们可以适当地增加该值的大小。但是需要注意的是,业务系统可能存在并行执行的复杂语句,如果这些语句都占用非常多的 work_mem 大小的资源,则可能会导致内存使用占满(如前文所述,openGauss 存在内存管控机制,一般不至于由于 OOM 导致系统重启)。故而,该值设置得很大的时候要关注系统的并发问题。该参数对 ORDER BY, DISTINCT, JOIN (merge join, hash join), HASH Agg, 基于 hash 的 IN 子查询都有影响。

enable_nestloop:开启该参数可以让优化器使用 Nest Loop Join(NLJ), 但是关闭该参数也不会完全压制优化器选择 NLJ. 对于某些复杂查询(如在 TPC-H benchmark 中的语句)来说,不应该选择 NLJ, 但是优化器往往会出现规划错误。那么,在此场景下,可以通过禁用该参数来鼓励优化器选择使用其他 JOIN 方法。

random_page_cost:一般与 seq_page_cost 配合调整。该参数调整数据库的 CBO 优化器中随机扫描的代价。该值设置得越大,数据库越认为随机扫描不可取,也就越不倾向于使用索引。该参数的默认值是 4,对于机械硬盘来说,是合适的。但是,如果业务系统的磁盘是固态硬盘的话,就应该适当调小一下该参数值,一般的经验是调整为 1.

default_statistics_target:当前 openGauss 的默认优化器是 CBO, 它高度依赖数据的统计信息。因此,对于复杂查询来说,更优质的统计信息往往可以获得更好的执行计划。通过增大该参数的值,可以获得更准确的统计信息,但是也会增加 ANALYZE 的时间。因此,对于复杂语句较多的场景,可以适当增加该参数值。

除了上述列出来的可能会影响 SQL 语句执行表现的系统参数外,还有很多参数可能会产生影响。不过,影响概率会小很多。如果用户希望检查一下数据库的参数配置是否合理,可以通过 DBMind 的参数推荐功能测试一下(该功能依赖当前正在运行的业务量,故不同时刻执行的效果可能会不同,建议在业务高峰时使用),相关使用帮助是:

代码语言:javascript复制
gs_dbmind component xtuner recommend –help

如果用户希望针对自己的业务试探出最合适的参数,也可以使用离线模式(tune 或 train 模式)。不过该场景一般是对未上线的业务系统进行初始调参,因为执行该功能可能会影响业务运行,故称之为离线模式。

资源竞争导致的慢SQL

当系统同时执行某些 SQL 语句的时候,它们可能会互相影响,进而导致某些SQL语句变为慢SQL, 这就是典型的资源竞争导致的慢SQL. 同时,不仅数据库中的语句们可能会进行资源竞争。在混合部署的环境中,操作系统上的其他任务也可能会影响数据库系统的表现。

对于一般的等待事件(wait event)来说,openGauss具备等待事件的记录视图,用户可以通过下列方法从宏观上查看 Top 级别的等待事件:

代码语言:javascript复制
select * from dbe_perf.wait_events order by total_wait_time desc;

一般来说,对于数据库外部原因导致的资源竞争包括 CPU、内存、IO 的竞争,最典型的情况是 IO 风暴(Freeze IO)、CPU 的计算资源的占用等。对于这种情况,一般不要将数据库与其他业务系统混合部署即可避免。

比较困难的是,数据库自己的某些任务之间互相影响,例如锁竞争、IO 竞争等。

数据库中的不同 SQL 语句对锁资源进行占用,阻塞了其他语句的正常执行,导致 SQL 语句变慢了,甚至还会触发死锁检测。比较简单的排查当前锁占用情况的 SQL 语句是:

代码语言:javascript复制
SELECT c.relkind,
       d.datname,
       c.relname,
       l.mode,
       s.query,
       extract(epoch
               FROM pg_catalog.now() - s.xact_start) AS holding_time
    FROM pg_locks AS l
    INNER JOIN pg_database AS d ON l.database = d.oid
    INNER JOIN pg_class AS c ON l.relation = c.oid
    INNER JOIN pg_stat_activity AS s ON l.pid = s.pid
    WHERE s.pid != pg_catalog.pg_backend_pid();

值得一提的是,openGauss 并不支持 pg_blocking_pids 函数。所以,通过该函数是无法查看到锁等待情况的。

下图展示了通过 DBMind 提供的 openGauss-exporter 监控到的数据库持锁情况:

还有一种情况是 IO 使用受到影响,例如系统正在进行 IO 操作时,执行某条 SQL 语句,该 SQL 语句对磁盘的访问被阻塞了。典型的数据库系统 IO 操作包括Analyze, Vacuum 以及 checkpoint 等。openGauss 为此做了很多优化,例如增量 checkpoint, 使用更大的版本号等(可以避免大量的 autovacuum for prevent wrap)。

当然,除了上面列出的情况外,还存在并发量接近或超过系统负荷导致的性能下降和拒绝服务。例如,大量复杂查询语句对 CPU 资源的竞争、大并发情况下引起数据库的响应时间变慢等。

就资源竞争引起的慢 SQL 来说,基本都可以通过系统指标来发现。例如监控慢SQL 发生时刻的 CPU、内存、IO、锁、网络等的使用情况,根据该慢 SQL 发生的背景信息即可推断出该慢SQL是否由资源竞争导致的,以及是何资源短缺导致的。对于penGauss 来说,DBMind 提供了非常强大的数据库指标采集功能,即DBMind 与 Prometheus 平台适配的 exporter. 用户可以直接通过下述命令查看 exporter 的启动参数:

openGauss-exporter: 用于采集数据库指标,除常规指标外,还能监控慢SQL、系统配置等。

代码语言:javascript复制
gs_dbmind component opengauss_exporter--help

reprocessing-exporter: 可以对Prometheus中已经采集到的指标进行聚合,例如计算QPS、内存使用率等。

代码语言:javascript复制
gs_dbmind component reprocessing_exporter--help

注意:openGauss 对于采集指标也进行了权限隔离,必须要求 openGauss-expoter 连接的用户具有 sysadmin, monadmin 权限才可以获取某些监控表的指标。

表本身包含大量数据

尽管 openGauss 对于大的行存表处理性能非常优秀,但表本身的数据情况依然是导致慢 SQL 的重要原因。一般来说,具有以下几种情况:

1. 表的数据量很大,且很少被缓存,导致语句需要扫描的元组很多;

2. 表的数据量很大,在修改、删除数据时需要修改较多的元组;

3. 向表中插入的数据量很大;

4. 业务上需要检索出的数据量很多;

5. 频繁的数据修改,导致表中存在很多死元组(dead tuple),影响扫描性能;

表的数据量较大导致的慢 SQL 问题,一般需要从业务上进行入手,直接通过修改数据库来达到优化慢 SQL 的目的是很难实现的。因此,需要用户分析具体的业务,对业务数据进行冷热分离、分库分表、使用分布式中间件等。如果希望在数据库层进行优化,则可以通过增加宿主机的内存,进而增加 max_process_memory、shared_buffers、work_mem 等的大小;使用性能更佳的磁盘;适当创建索引;使用表空间调整磁盘布局等。

SQL语句写得很差

由 SQL 语句写法问题导致的慢 SQL 也相对多见,这类写得比较差的慢 SQL 也被俗称为“烂SQL”。多数情况都下,由“烂SQL”导致的索引失效的问题较多,对于这种情况,可参考前面的描述对 SQL 语句进行改写,使其能够使用到索引。

除了修改慢 SQL 使其能够使用索引,下面还列出了几种比较常见的、可能优化 openGauss 数据库性能的 SQL 改写规则:

改写规则

改写条件

改写说明

原始查询语句示例

改写后语句示例

将'select distinct *'改写为'select *'

所查询表格含唯一列或主键

通过确定tuple无重复,去掉distinct,从而省去去重步骤,提升效率

select distinct * from bmsql_customer limit 10;

select * from bmsql_customer limit 10;

将having子句中条件放到where子句中

-

将谓词表达式提前,可有效缩减group时的数据集

select cfg_name from bmsql_config group bycfg_name having cfg_name='1'

select cfg_name from bmsql_config where cfg_name = '1' group by cfg_name

简化where子句中谓词表达式

-

某些复杂谓词无法有效触发openGauss内的rewrite逻辑,无法使用索引扫描

select o_w_id, o_d_id, o_id, o_c_id from bmsql_oorder where o_w_id 1> 3

select o_w_id, o_d_id, o_id, o_c_id from bmsql_oorder where o_w_id > 2

将order by或group by中的无用列去掉

group by或order by涉及的列包含在where子句中的等值表达式中

去掉无用字段,SQL更为简洁

select cfg_name from bmsql_config where cfg_name='2' group by cfg_name order by cfg_name, cfg_value

select cfg_name from bmsql_config where cfg_name = '2' order by cfg_value

去掉where子句中永为真的表达式

-

去掉无用字段,SQL更为简洁

select * from bmsql_config where 1=1 and 2=2limit 10

select * from bmsql_config limit 10

将union转换为union all

-

避免了去重带来的执行代价

select * from bmsql_config union select * from bmsql_config

select * from bmsql_config unionall select * from bmsql_config

将delete语句转换为truncate语句

无where子句

将DML语句转换为DDL语句,一次性回收表空间,执行速度更快

delete from bmsql_config

truncate table bmsql_config

将where子句中'or'连接的等式转换为'in'结构

-

'in'结构可加快过滤速度

select * from bmsql_stock where s_w_id=10 or s_w_id=1 or s_w_id=100 or s_i_id=1 or s_i_id=10

select * from bmsql_stock where s_w_id in (1,10,100) or s_i_id in(1,10)

将selfjoin查询拆分为效率更高两个子查询

1) self join查询。2) where子句包含相同列差值的范围查询。例如1<a.id-b.id<10,其中a,b为同一个表的两个alias。

通过等值谓词加快查询速度

select a.c_id from bmsql_customer a, bmsql_customer b where a.c_id - b.c_id <= 20 and a.c_id > b.c_id

select * from (select a.c_id from bmsql_customer as a, bmsql_customer as b where trunc((a.c_id) / 20) = trunc(b.c_id / 20) and a.c_id > b.c_id union all select a.c_id from bmsql_customer as a, bmsql_customer as b where trunc((a.c_id) / 20) = trunc(b.c_id / 20 1) and a.c_id - b.c_id <= 20)

对于业务系统,SQL 语句上线之前的审计工作基本都可以覆盖上述的场景,业内也具备很多对 SQL 语句进行改写的工具,不过这些工具的一些改写规则并不是绝对意义上的等值改写。而且,很多改写条件对于 openGauss 来说不见得有效,因为 openGauss 在数据库内部也存在 rewrite 逻辑。

DBMind 平台会进一步演进 SQL 语句的智能改写功能,提供给用户在线的交互式智能查询改写能力,预计在未来的版本中与用户见面。

总结

我们在上面已经列出了能够导致慢 SQL 的原因,基本覆盖了在 openGauss 上造成慢 SQL 的大多数原因。不过,one-by-one 手动地进行慢 SQL 检查对于用户来说工作量确实太大。故而,openGauss 的 DBMind 功能本身已经集成了对慢 SQL 进行智能根因识别的能力,用户可以通过运行下述命令在后台启动慢 SQL 根因分析功能(需要首先部署 Prometheus 以及 expoter,以便能够采集到监控指标):

代码语言:javascript复制
gs_dbmind servicestart-c confpath--only-run slow_query_diagnosis

注:显式指定 --only-run 参数可以仅启动被选择的DBMind服务项

被诊断后的慢 SQL 会存储在元数据库(存放诊断结果的数据库)中,用户可以通过下述命令查看:

代码语言:javascript复制
gs_dbmind component slow_query_diagnosisshow-c confpath--query SQL --start-time timestamps0 --end-time timestamps1

也可以通过与 Grafana 联合来展示慢 SQL 的分析结果,DBMind 也提供了简单的 Grafana 配置模板,可供用户参考:

代码语言:javascript复制
https://github.com/opengauss-mirror/openGauss-server/blob/master/src/gausskernel/dbmind/tools/misc/grafana-template-slow-query-analysis.json

由于 openGauss 官方网站的发行包中的 DBMind 可能滞后于代码托管平台(gitee或github)上的最新代码,直接编译 openGauss 又需要花费很多的时间。故而,如果用户只是想单纯提取最新的 DBMind 功能,可以通过下面的 Linux 命令来实现:

代码语言:javascript复制
git clone-b master--depth 1 https://gitee.com/opengauss/openGauss-server.git
cd openGauss-server/src/gausskernel/dbmind/
mv tools dbmind
tar zcf dbmind.tar.gz gs_dbmind dbmind

将生成的 dbmind.tar.gz 压缩包在合适的部署位置解压即可。

当然,如果用户希望手动检查一下慢 SQL 的原因,也可以根据附表的检查项来检查慢 SQL 的产生原因。

附表:慢 SQL 检查列表

检查项

检查方式(系统表或系统视图)

检查方法

语句执行时存在锁竞争

dbe_perf.statement_history(start_time,finish_time, query)、pg_locks(pid, mode, locktype, grant)、pg_stat_activity(xact_start, query_start, query, pid)

查询在语句执行期间是否被阻塞。

表中死元组占比超过设定阈值

dbe_perf.statement_history(query, dbname, schemaname)pg_stat_users_tables(relname, schemaname,n_live_tup, n_dead_tup)

n_dead_tup / n_live_tup,占比超过阈值则认为表过度膨胀(默认阈值:0.2)。

语句扫描行数较多

dbe_perf.statement_history(n_tuples_fetched, n_tuples_returned, n_live_tup, n_dead_tup)

n_tuples_fetched n_tuples_returned,超过阈值则认为过大(默认阈值:10000)。

语句缓存命中率较低

dbe_perf.statement_history(n_blocks_fetched, n_blocks_hit)

n_block_hit / n_block_fetched,小于阈值则认为较低(默认阈值:0.95)

慢SQL(delete、insert、update)相关表存在冗余索引

dbe_perf.statement_history(dbname, schemaname, query), pg_stat_user_indexes(schemaname, relname, indexrelname, idx_scan, idx_tup_read, idx_tup_fetch)pg_indexes(schemaname, tablename, indexname, indexdef)

SQL相关表满足:① 不是唯一索引;②(idx_scan, idx_tup_read,idx_tup_fetch)=(0,0,0);③ 索引不在数据库的('pg_catalog', 'information_schema','snapshot', 'dbe_pldeveloper')schema下。如果满足则认为次索引为冗余索引,否则为有效索引。

更新数据量较多

dbe_perf.statement_history(query, n_tuples_updated)pg_stat_user_tables(n_live_tup, n_dead_tup)

n_tuples_updated超过阈值则认为更新数据量较多(默认阈值:1000)。

插入数据量较多

dbe_perf.statement_history(query, n_tuples_inserted)pg_stat_user_tables(n_live_tup, n_dead_tup)

n_tuples_inserted超过阈值则认为插入数据量较多(默认阈值:1000)。

删除数据量较多

dbe_perf.statement_history(query, n_tuples_deleted)pg_stat_user_tables(n_live_tup, n_dead_tup)

n_tuples_deleted超过阈值则认为删除数据量较多(默认阈值:1000)。

相关表索引个数较多

pg_stat_user_indexes(relname,schemaname, indexrelname)

如果表中索引数大于阈值并且索引与字段数比率超过设定阈值,则认为索引数较多(索引个数阈值:3,比率默认阈值:0.6)。

执行语句发生落盘(外排序)行为

dbe_perf.statement(sort_count, sort_spilled_count, sort_mem_used, hash_count, hash_spilled_count, hash_ued_mem, n_calls)

分析指标判断是否有hash或者order导致的落盘行为,主要逻辑为:1 如果sort_count或者hash_count不为0,sort_mem_used或者hash_mem_used为0,则此SQL一定发生了落盘行为;2 如果sort_spilled_count或者hash_spilled_count不为0,则执行可能发生落盘行为;

语句执行期间相关表正在执行AUTOVACUUM或AUTOANALYZE操作

dbe_perf.statement_history(start_time, finish_time, query)pg_stat_user_tables(last_autovacuum, last_autoanalyze)

执行SQL期间,正在发生vacuum或者analyze行为。

数据库TPS较大

dbe_perf.statement_history(start_time, finish_time)pg_stat_database(datname, xact_commit, xact_rolback)

相对于正常业务时的TPS,当前TPS增长较大,则认为数据库TPS较大;TPS短期内增长异常则认为是业务风暴。

IOWait指标大于设定阈值

系统IOWait指标异常升高

IOWait大于用户设定阈值(默认阈值:10%)

IOPS指标大于设定阈值

系统IOPS指标异常

IOPS指标大于用户设定阈值(默认阈值:1000)。

load average指标大于设定阈值

系统load average指标异常

load average与服务器逻辑核数比率大于用户设定阈值(默认阈值:0.6)。

CPU USAGE指标大于设定阈值

系统CPU USAGE指标异常

CPU USAGE指标大于用户设定阈值(默认阈值:0.6)。

IOUTILS指标大于设定阈值

系统IOUTILS指标异常

IOUTILS(磁盘利用率)大于用户设定阈值(默认阈值:0.5)。

IOCAPACITY指标大于设定阈值

系统IO CAPACITY指标异常

IOCAPACITY(IO吞吐量)大于用户设定阈值(默认阈值:50MB/s)。

IODELAY指标大于设定阈值

系统IO DELAY指标异常

IO DELAY(IO延迟)大于用户设定阈值(默认阈值:50ms)。

网卡丢包率

系统网卡丢包率异常

NETWORK DROP RATE大于用户设定阈值(默认0阈值:0.01)。

网卡错误率

系统网卡错误率异常

NETWORK ERROR RATE大于用户设定阈值(默认阈值:0.01)。

线程池占用量异常

dbe_perf.global_threadpool_status

数据库线程池使用率大于阈值(默认阈值:0.95)

连接池占用量异常

pg_settings.max_connections,pg_stat_activity

数据库连接池占用率大于阈值(默认阈值:0.8)

双写延迟较大

dbe_perf.wait_events

双写延迟大于阈值(默认阈值:100us)

表长时间未更新

pg_stat_user_tables

表未更新时长超过阈值(默认阈值:60s)

checkpoint效率低(本规则仅作为粗略判断)

pg_stat_bgwriter

数据库buffers_backend与(buffers_clean buffers_checkpoint)占比小于阈值(默认阈值:1000)

主备复制效率较低

pg_stat_replication

主备write_diff、replay_diff、sent_diff超过阈值(默认阈值:500000)

执行计划存在异常seqscan算子

执行计划

seqscan算子代价与总代价比率超过阈值(默认阈值:0.3),此特征也会判断是否缺少相关索引。

执行计划存在异常nestloop算子

执行计划

nestloop算子代价与总代价比率超过阈值(默认阈值:0.3)并且进行nestloop的结果集行数超过阈值(默认阈值:10000)。

执行计划存在异常hashjoin算子

执行计划

hashjoin算子代价与总代价比率超过阈值(默认阈值:0.3)并且进行hashjoin的结果集小于阈值(默认阈值:10000)。

执行计划存在异常groupagg算子

执行计划

groupagg算子代价与总代价比率超过阈值(默认阈值:0.3)并且执行groupagg的行数超过阈值(默认阈值:10000)。

SQL写法不优

SQL文本、pg_stat_user_tables

SQL写法不优导致执行性能较差

SQL执行被定时任务影响

pg_job,dbe_perf.statement_history

定时任务执行影响了SQL执行性能,考虑调整定时任务时间,避免产生影响。

执行计划生成时间较长

dbe_perf.statement_history

SQL执行计划生成时间较长。

参考资料

[1].https://www.2ndquadrant.com/en/blog/managing-freezing/

[2]. http://mysql.taobao.org/monthly/2016/06/03/

[3].https://www.2ndquadrant.com/en/blog/basics-of-tuning-checkpoints/

[4]. https://lwn.net/Articles/591723/

[5].https://dev.mysql.com/doc/refman/8.0/en/glossary.html

[6].https://github.com/opengauss-mirror/openGauss-server/tree/master/src/gausskernel/dbmind

0 人点赞