微信群自建立以来,就致力于为大家提供一个严谨又不失温情的技术交流环境。
我们也在不断地调整与改善,相信社区群在大家的监督下,可以变得更加enjoyable!
在这里为大家整理了一些问答集锦
快来跟kuma一起感受下群内积极好学的氛围吧
ε-(=`ω´=)
Q: 我设置了四挡告警,为何只显示出三挡?
A1: 看了前端源码,最多就显示3个触发器, 但实际第四档位如果触发告警值,也会告警.
Q: 告警太多,有点狼来了的意思,咋整呢
A1: 告警收敛, 或者调整 trigger的阈值
A2: 触发器解决, 高于某个值触发报警,低于某值才恢复 有个区间 解决虚警, 多研究下, 选择合适的触发器,以及组合
A3: 对业务有影响的(即将产生影响或者已经产生影响的)才需要发告警,否则就不是告警而是骚扰,这个问题我发现绝大多数人都没想明白
A4: 报警不应该是大而全的 只有重要的才需要报警 并且需要及时处理 否则就失去了意义, 技术和管理相结合, 精简不必要的trigger, 我们设置了分层的trigger, warning和disaster, disaster会发给老板, 这样在管理上 强制要求对应的it人员去处理
A3: 告警分类分层,还有时间处理时间上也需要分层,比如某个事件超过多长时间还没处理,就升级告警到更高级别的经理或主管那
Q: 怎么设置一个触发器: 某个监控item持续5分钟返回的值都是0?
A1: count函数,max函数都可以
A2: 检查每一个last()的值为零并且delta(5m)等于零
A3: 最后5min的最大值为0
Q: net.udp.listen[port]暂不支持WINDOWS的,各位是如何监控WIN的UDP端口的呢
A: Template TCP/UDP Windows connections(Windows TCP/UDP连接监控模板)
https://share.zabbix.com/operating-systems/windows/template-tct-udp-windows-connections
Q: zabbix agent模式取值,可用性的Z灯没亮,但是可以取到值,这之间有什么联系呢?
A: 主被动模式,主动不亮,Z灯和被动模式下获取值有关
Q: 问个初级的问题:Server-Proxy的界面和Server的界面相同吗?如果proxy装在局域网内,断网情况下,是否可以利用proxy单独来监控设备。
A: 可能已监控,但无法查看监控结果。proxy没web,这样的环境可以使用server模式。任意server下线不影响。
A2: 用node,node有。
Q: 多server可以相互关联吗?用云建立一个server,然后具体的项目在局域网中部署一个server这样可以吗?
A1: 可以的,要注意多个web前端的server连接同一个zabbix_server将会只有最后一个是正常连接的,也可能不是。
Q: zabbix中基本检测的ping检测默认多长时间ping一次一次ping几个包?多久一次?
A1: 仔细阅读文档,有说明是三个,多久一次是在item里自己设置
Q: perf_counter[counter,<interval>]问个纠结很久的问题,这个key里的interval干啥用的,不明白啊?求解释下
A1: perf_counter里的interval可不是采集之间的时间间隔。Update interval和Custom intervals也是两回事,默认是Update interval有效,但是如果Custom intervals设置为Scheduling,会覆盖掉Update interval。
Update interval是默认的item值轮询时间,Period就是默认的1-7,00:00-24:00,但是如果Custom intervals设置为Scheduling,Period会被覆盖掉,所以我对zbx将Scheduling中的Period命名为Interval感觉有点奇怪,明明就是个时间区间嘛。
刚才看了一眼文档,如果Custom intervals的type设置为Flexible,Interval和Period都设置了值,则会覆盖掉Update interval的设置值
Q: 比如要取X的值,和Y的值。。X是变化的,Y也是变化的,我在zabbix 图表该怎么显示呢?X 和 Y是对应的。8个人,去钓鱼,我要取前五名钓鱼数量最多的。人也会变,鱼也会变,鱼的变化决定人的变化。我要先监控鱼的数量,达到阈值取出他们对应的人,是这个意思。
A1: 在我的理解,这就是两个监控项
A2: 那就是lld取前五名。五个监控项,低级发现,比如我监控接口,我不知道有什么接口,但是这个接口报错了,我知道,当接口出现保错,我就开始记录这个接口报错次数,生成监控,有8个人我不知道谁是前五名,当出现前五。这五个人我自动监控上。
A3: 第一个item,获取top1的队列,第二个item,获取top2的队列,以此类推
Q: 如果我的系统里面还有经常关闭电源的设备,那么如何与宕机做区分呢?
A1: 写个小web界面,把停电计划维护进去,后台计划任务自动去调用zbx api启停这些设备的监控,很简单
A2: 确认了下 ,discovery可以触发enable host
A3: 这样 你再设置一个discovery,开机的时候 ,被发现后可以触发 enable