腾讯云数据库监控告警消息配置最佳实践

2022-11-09 11:09:56 浏览数 (2)

适用场景1 :预警性能瓶颈的发生。

Mysql云监控指标告警推荐配置

  • 策略类型:云数据库/MySQL/主机监控

连接使用率 >= 80%,持续粒度5s,持续3个数据点,每小时告警一次

CPU使用率 >= 80%,持续粒度5s,持续3个数据点,每小时告警一次

磁盘利用率>= 80%,持续粒度5s,持续3个数据点,每小时告警一次

运行线程数>= min{64,实例CPU核数*4},持续粒度5s,持续3个数据点,每小时告警一次

  • 策略类型:云数据库/MySQL/主机监控 (仅针对只读实例配置)

IO线程状态 !=0,持续粒度5s,持续3个数据点,每小时告警一次

SQL线程状态 !=0,持续粒度5s,持续3个数据点,每小时告警一次

主从延迟时间>=600s,持续粒度5s,持续3个数据点,每小时告警一次

主从延迟距离>=500MB,持续粒度5s,持续3个数据点,每小时告警一次

  • 策略类型:云数据库/MySQL/备机监控(仅针对主实例、灾备实例配置)

IO线程状态 !=0,持续粒度5s,持续3个数据点,每小时告警一次

SQL线程状态 !=0,持续粒度5s,持续3个数据点,每小时告警一次

主从延迟时间>=600s,持续粒度5s,持续3个数据点,每小时告警一次

主从延迟距离>=500MB,持续粒度5s,持续3个数据点,每小时告警一次

Redis云监控指标告警推荐配置(仅供参考)

  • 策略类型:云数据库/Redis/内存版(5秒粒度)/Proxy节点

出流量使用率 >= 80%,持续粒度5s,持续3个数据点,每小时告警一次

出流量限流触发 >= 1Count,持续粒度5s,持续3个数据点,每小时告警一次

入流量使用率 >= 80%,持续粒度5s,持续3个数据点,每小时告警一次

入流量限流触发 >= 1Count,持续粒度5s,持续3个数据点,每小时告警一次

连接使用率 >= 80%,持续粒度5s,持续3个数据点,每小时告警一次

CPU使用率 >= 80%,持续粒度5s,持续3个数据点,每小时告警一次

  • 策略类型:云数据库/Redis/内存版(5秒粒度)/Redis节点

CPU使用率 >= 80%,持续粒度5s,持续3个数据点,每小时告警一次

内存使用率 >= 80%,持续粒度5s,持续3个数据点,每小时告警一次

连接使用率>= 80%,持续粒度5s,持续3个数据点,每小时告警一次

参考文档:

1,配置告警 云数据库 Redis 配置告警-操作指南-文档中心-腾讯云

2,Redis 5秒粒度各指标说明:云数据库 Redis 监控功能(5秒粒度)-操作指南-文档中心-腾讯云

【注】告警阈值、重复次数仅供参考,可以基于业务需要进行调整。

适用场景2:监控故障场景的发生。

Mysql推荐配置事件规则

事件模式:云服务预设事件

云服务类型:云数据库Mysql

事件类型:内存OOM

主从切换

只读实例剔除

服务器故障导致实例迁移

数据库代理挂载节点剔除(仅适用于开通数据库代理的实例)

数据库代理异常(仅适用于开通数据库代理的实例)

Redis推荐配置事件规则

事件模式:云服务预设事件

云服务类型:云数据库Redis

事件类型:主备切换

服务不可用

只读副本故障切换(适用于开通副本只读功能的实例)

只读副本不可用(适用于开通副本只读功能的实例)

服务器故障导致实例迁移

参考文档:

快速配置云监控事件告警推送:事件总线 快速配置云监控事件告警推送-快速入门-文档中心-腾讯云

云数据库Mysql云监控事件:事件总线 云监控事件-事件-文档中心-腾讯云

云数据库Redis云监控事件:事件总线 云监控事件-事件-文档中心-腾讯云

0 人点赞