撸了今年阿里、头条和美团的面试,我有一个重要发现.......>>>
zabbix触发器无法执行动作
2018年08月26日 11:27:02 wangjiadongge 阅读数 3902更多
分类专栏: linux
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/wangjiadongge/article/details/82079076
遇到一个坑爹的问题,必须记录下来。
问题描述:监控的主机分为了多个组,用户专门建了一个用于接收报警的组,然而这个组成员只能接收某个主机的报警,而不能接收其他主机的报警(现在回想起来了,最后那几个组是新创建的)。
排查的过程:
先让其触发一个告警,然后触发器没有执行动作,检查了报警媒介、触发器、动作,都没问题。奇怪……
手动发送邮件测试也没问题,只能放大招了,重启zabbix_server,结果还是不行……
只能放终极大招了,重启linux系统。还是不行……
他大爷的,最后看了一下用户组,原来新建的监控主机组不在用户组中,并没有权限。
oh fuck!what's happened?
可以了!
另一种可能:
通过查看agent日志,4200:20170928:173000.693 no active checks on server [47.93.x.x:10051]: host [iZrwn7pkbbterpZ] not found
解决:这种问题一般是zabbix web 主机配置中的名字和agent端的agent.conf中的hostname名字不一致导致的。对比着zabbix web中的主机名字修改agent.conf即可解决。
注意:这里涉及到监控的主动模式和被动模式,如果是用被动模式,那么主机名必须和zabbix web一致,否则就用主动模式,在zabbix—gent注释掉:ServerActive=x.x.x.x:10051和#Hostname=Windows
另一种可能:存在历史记录,需要清除历史记录,重新添加模板,尤其是触发器使用了模板。