本节主要从监控告警的角度,深入了解腾讯云snova平台的监控机制和策略。完善的告警系统,能够获取当前服务端snova的运行情况,当snova某个指标波动超过正常阈值时进行警报提示,以及时止损,保证平台稳定运行和故障修复的及时介入。
目录:
- 告警系统概览
- 配置告警策略
基本概念:
IOPS | 每秒磁盘IO的读写次数 |
---|---|
吞吐量 | 每秒磁盘 I/O 的流量,即磁盘写入加上读出的数据的大小。 |
1.告警系统概览
- 监控地址:用户控制台点击snova进入 https://console.cloud.tencent.com/snova
- 点击集群名称进入详细页面,选择性能监控
- 参数详解:
名称 | 释义 |
---|---|
cpu利用率 | 又称CPU使用率。顾名思义,CPU利用率是来描述CPU的使用情况,表明了一段时间内CPU被占用的情况。 |
内存利用率 | % |
网络接收吞吐量 | MB/s 流入网卡 |
网络输出层吞吐量 | MB/s 流出网卡 |
写入IOPS | count/s |
读取IOPS | count/s |
磁盘空间使用率 | % |
读取吞吐量 | MB/s |
写入吞吐量 | MB/s |
读取延时 | ms |
写入延时 | ms |
连接数 | 个 |
- 时间粒度
2.配置告警策略
- 搜索云监控
- 选择告警策略并新增
- 新增策略 绑定对象 配置触发条件 添加告警渠道
未完待续;