Snova运维篇(五):snova平台监控告警的使用

2019-12-26 18:17:51 浏览数 (1)

本节主要从监控告警的角度,深入了解腾讯云snova平台的监控机制和策略。完善的告警系统,能够获取当前服务端snova的运行情况,当snova某个指标波动超过正常阈值时进行警报提示,以及时止损,保证平台稳定运行和故障修复的及时介入。

目录:

  1. 告警系统概览
  2. 配置告警策略

基本概念:

IOPS

每秒磁盘IO的读写次数

吞吐量

每秒磁盘 I/O 的流量,即磁盘写入加上读出的数据的大小。


1.告警系统概览

  • 监控地址:用户控制台点击snova进入 https://console.cloud.tencent.com/snova
  • 点击集群名称进入详细页面,选择性能监控
  • 参数详解:

名称

释义

cpu利用率

又称CPU使用率。顾名思义,CPU利用率是来描述CPU的使用情况,表明了一段时间内CPU被占用的情况。

内存利用率

%

网络接收吞吐量

MB/s 流入网卡

网络输出层吞吐量

MB/s 流出网卡

写入IOPS

count/s

读取IOPS

count/s

磁盘空间使用率

%

读取吞吐量

MB/s

写入吞吐量

MB/s

读取延时

ms

写入延时

ms

连接数

  • 时间粒度

2.配置告警策略

  • 搜索云监控
  • 选择告警策略并新增
  • 新增策略 绑定对象 配置触发条件 添加告警渠道

未完待续;

0 人点赞