大佬们在群里都在聊些什么?

2021-02-03 10:38:04 浏览数 (1)

近期讨论精华集锦

微信群自建立以来,就致力于为大家提供一个严谨又不失温情的技术交流环境。

我们也在不断地调整与改善,相信社区群在大家的监督下,可以变得更加enjoyable!

在这里为大家整理了一些问答集锦

快来跟kuma一起感受下群内积极好学的氛围吧

ε-(=`ω´=)

Q: 我设置了四挡告警,为何只显示出三挡?

A1: 看了前端源码,最多就显示3个触发器, 但实际第四档位如果触发告警值,也会告警.

Q: 告警太多,有点狼来了的意思,咋整呢

A1: 告警收敛, 或者调整 trigger的阈值

A2: 触发器解决, 高于某个值触发报警,低于某值才恢复 有个区间 解决虚警, 多研究下, 选择合适的触发器,以及组合

A3: 对业务有影响的(即将产生影响或者已经产生影响的)才需要发告警,否则就不是告警而是骚扰,这个问题我发现绝大多数人都没想明白

A4: 报警不应该是大而全的 只有重要的才需要报警 并且需要及时处理 否则就失去了意义, 技术和管理相结合, 精简不必要的trigger, 我们设置了分层的trigger, warning和disaster, disaster会发给老板, 这样在管理上 强制要求对应的it人员去处理

A3: 告警分类分层,还有时间处理时间上也需要分层,比如某个事件超过多长时间还没处理,就升级告警到更高级别的经理或主管那

Q: 怎么设置一个触发器: 某个监控item持续5分钟返回的值都是0?

A1: count函数,max函数都可以

A2: 检查每一个last()的值为零并且delta(5m)等于零

A3: 最后5min的最大值为0

Q: net.udp.listen[port]暂不支持WINDOWS的,各位是如何监控WIN的UDP端口的呢

A: Template TCP/UDP Windows connections(Windows TCP/UDP连接监控模板)

https://share.zabbix.com/operating-systems/windows/template-tct-udp-windows-connections

Q: zabbix agent模式取值,可用性的Z灯没亮,但是可以取到值,这之间有什么联系呢?

A: 主被动模式,主动不亮,Z灯和被动模式下获取值有关

Q: 问个初级的问题:Server-Proxy的界面和Server的界面相同吗?如果proxy装在局域网内,断网情况下,是否可以利用proxy单独来监控设备。

A: 可能已监控,但无法查看监控结果。proxy没web,这样的环境可以使用server模式。任意server下线不影响。

A2: 用node,node有。

Q: 多server可以相互关联吗?用云建立一个server,然后具体的项目在局域网中部署一个server这样可以吗?

A1: 可以的,要注意多个web前端的server连接同一个zabbix_server将会只有最后一个是正常连接的,也可能不是。

Q: zabbix中基本检测的ping检测默认多长时间ping一次一次ping几个包?多久一次?

A1: 仔细阅读文档,有说明是三个,多久一次是在item里自己设置

Q: perf_counter[counter,<interval>]问个纠结很久的问题,这个key里的interval干啥用的,不明白啊?求解释下

A1: perf_counter里的interval可不是采集之间的时间间隔。Update interval和Custom intervals也是两回事,默认是Update interval有效,但是如果Custom intervals设置为Scheduling,会覆盖掉Update interval。

Update interval是默认的item值轮询时间,Period就是默认的1-7,00:00-24:00,但是如果Custom intervals设置为Scheduling,Period会被覆盖掉,所以我对zbx将Scheduling中的Period命名为Interval感觉有点奇怪,明明就是个时间区间嘛。

刚才看了一眼文档,如果Custom intervals的type设置为Flexible,Interval和Period都设置了值,则会覆盖掉Update interval的设置值

Q: 比如要取X的值,和Y的值。。X是变化的,Y也是变化的,我在zabbix 图表该怎么显示呢?X 和 Y是对应的。8个人,去钓鱼,我要取前五名钓鱼数量最多的。人也会变,鱼也会变,鱼的变化决定人的变化。我要先监控鱼的数量,达到阈值取出他们对应的人,是这个意思。

A1: 在我的理解,这就是两个监控项

A2: 那就是lld取前五名。五个监控项,低级发现,比如我监控接口,我不知道有什么接口,但是这个接口报错了,我知道,当接口出现保错,我就开始记录这个接口报错次数,生成监控,有8个人我不知道谁是前五名,当出现前五。这五个人我自动监控上。

A3: 第一个item,获取top1的队列,第二个item,获取top2的队列,以此类推

Q: 如果我的系统里面还有经常关闭电源的设备,那么如何与宕机做区分呢?

A1: 写个小web界面,把停电计划维护进去,后台计划任务自动去调用zbx api启停这些设备的监控,很简单

A2: 确认了下 ,discovery可以触发enable host

A3: 这样 你再设置一个discovery,开机的时候 ,被发现后可以触发 enable

0 人点赞