代码语言:javascript复制
#!/bin/bash
#########################################################
# shell :获取集群告警并通过钉钉告出
#########################################################
# 告警级别说明:
# CRITICAL:对应CM界面的红色感叹号告警或者对应ERROR级别的日志告警
# IMPORTANT:对应CM中的黄色感叹号告警或者对应WARN级别的日志告警
# INFORMATIONAL:主要是一些CM界面登录信息和集群健康检查信息
# 获取当日日期
date=`date ' %Y-%m-%d'`
# 获取告警日志
OG_ALERT_FILE=$1
# 定义告警解析后日志文件
ALERT_RESULT_FILE=/opt/cloudera/script/alert_result_${date}.log
# 告警解析存放目录,将原始的告警日志转换为一行行的json存储
TMP_ALERT_FILE=/opt/cloudera/script/tmp_alert.json
# 循环分解json消息,获得有用的信息
cat $OG_ALERT_FILE | jq -r '.[].body.alert|"(.attributes)"' > $TMP_ALERT_FILE
while read -r line
do
cluster=$(echo -e $line | jq -r '.CLUSTER_DISPLAY_NAME[]')
hostname=$(echo -e $line |jq -r '.HOSTS[]')
if [ $? -ne 0 ];then
hostname=null
fi
echo -e $line | jq -r '.|"(.HEALTH_TEST_RESULTS[])"' |while read alert; do
alert_service=$(echo -e $alert | jq -r '.testName')
alert_enent_doce=$(echo -e $alert | jq -r '.code')
alert_content=$(echo -e $alert | jq -r '.content')
alert_severity=$(echo -e $alert | jq -r '.severity')
text="告警:告警集群:[$cluster],告警主机:[$hostname],告警级别:[$alert_severity],告警服务:[$alert_service],告警事件编码:[$alert_enent_doce],告警详细内容:[$alert_content]"
# 将告警信息保留在本地一份
echo $text >> /opt/cloudera/script/alert_result_${date}.log
# 发送告警信息
curl https://oapi.dingtalk.com/robot/send?access_token=${钉钉群机器人token}
-H "Content-type: application/json"
-X POST
-d '{"msgtype": "text","text": {"content": "'"$text"'"}}'
done
done < $TMP_ALERT_FILE
钉钉群机器人特征字为:告警。
参考:https://blog.csdn.net/weixin_40817778/article/details/119249820