[1192]获取CDH集群告警并通过钉钉告出

2023-10-10 08:31:16 浏览数 (3)

代码语言:javascript复制
#!/bin/bash
 
#########################################################
# shell :获取集群告警并通过钉钉告出                                                        
#########################################################
# 告警级别说明:
# CRITICAL:对应CM界面的红色感叹号告警或者对应ERROR级别的日志告警
# IMPORTANT:对应CM中的黄色感叹号告警或者对应WARN级别的日志告警
# INFORMATIONAL:主要是一些CM界面登录信息和集群健康检查信息
 
# 获取当日日期
date=`date ' %Y-%m-%d'`
 
# 获取告警日志
OG_ALERT_FILE=$1
 
# 定义告警解析后日志文件
ALERT_RESULT_FILE=/opt/cloudera/script/alert_result_${date}.log
 
# 告警解析存放目录,将原始的告警日志转换为一行行的json存储
TMP_ALERT_FILE=/opt/cloudera/script/tmp_alert.json
 
# 循环分解json消息,获得有用的信息
cat $OG_ALERT_FILE | jq -r '.[].body.alert|"(.attributes)"' > $TMP_ALERT_FILE
while read -r line
    do
        cluster=$(echo -e $line | jq -r '.CLUSTER_DISPLAY_NAME[]')
        hostname=$(echo -e $line |jq -r '.HOSTS[]')
        if [ $? -ne 0 ];then
            hostname=null
        fi
        echo -e $line | jq -r '.|"(.HEALTH_TEST_RESULTS[])"' |while read alert; do
            alert_service=$(echo -e $alert | jq -r '.testName')
            alert_enent_doce=$(echo -e $alert | jq -r '.code')
            alert_content=$(echo -e $alert | jq -r '.content')
            alert_severity=$(echo -e $alert | jq -r '.severity')
            text="告警:告警集群:[$cluster],告警主机:[$hostname],告警级别:[$alert_severity],告警服务:[$alert_service],告警事件编码:[$alert_enent_doce],告警详细内容:[$alert_content]"
# 将告警信息保留在本地一份
            echo $text >> /opt/cloudera/script/alert_result_${date}.log
# 发送告警信息
            curl https://oapi.dingtalk.com/robot/send?access_token=${钉钉群机器人token} 
            -H "Content-type: application/json" 
            -X POST 
            -d '{"msgtype": "text","text": {"content": "'"$text"'"}}'
            done
    done < $TMP_ALERT_FILE

钉钉群机器人特征字为:告警。

参考:https://blog.csdn.net/weixin_40817778/article/details/119249820

0 人点赞