1. Skywalking 告警
通过/apps/apache-skywalking-apm-bin/config/oal/core.oal 定义指标数据如何查询数据 通过/apps/apache-skywalking-apm-bin/config/alarm-settings.yml定义告警规则.
对一定时间范围内的数据进行计算后告警.
2. Skywalking常用告警指标
代码语言:javascript复制config/oal/core.oal
https://github.com/apache/skywalking/blob/master/docs/en/setup/backend/backend-alarm.md
3. Skywalking配置文件
alarm-settings.yml
4. 默认报警规则
默认情况下alarm-setting.yml在发行版中提供了默认值。它包括以下规则:
- 过去 3 分钟内服务平均响应时间超过 1 秒。
- 最后2分钟服务成功率低于80%。
- 过去 3 分钟内超过 1 秒的服务响应时间百分比
- 服务实例最近 2 分钟平均响应时间超过 1 秒,并且实例名称与正则表达式匹配。
- 过去 2 分钟内端点平均响应时间超过 1 秒。
- 过去 2 分钟内数据库访问平均响应时间超过 1 秒。
- 过去 2 分钟内端点关系平均响应时间超过 1 秒。
5. 钉钉告警发送
修改配置文件alarm-settings.yml
当对服务发起访问,就从钉钉告警
代码语言:javascript复制rules:
service_cpm_rule:
metrics-name: service_cpm
op: ">"
threshold: 1
period: 2
count: 1
silence-period: 2
message: 服务 {name} 访问次数大于1
dingtalkHooks:
textTemplate: |-
{
"msgtype": "text",
"text": {
"content": "Apache SkyWalking Alarm: n %s."
}
}
webhooks:
- url: https://oapi.dingtalk.com/robot/send?access_token=1179c64f197a5da70d4b393111dd47578e58f8112e22f3e00d6632591337c43a
当对应用发起访问,就会触发钉钉告警
在skywalking控制台中也能看到告警触发记录
作者:上海_运维_Q先生
源链接:https://blog.csdn.net/qq_29974229/article/details/126832609
格式整理:IT运维技术圈