【外网干货翻译】解读Zabbix队列

2021-02-03 10:38:45 浏览数 (1)

多次在群里看到大佬们分享这篇解读Zabbix队列的博文

特此翻译给大家以作参考

原博链接Queue Explained(点击跳转)

关于Zabbix队列

文| Ricardo Santos

Ricardo Santos拥有超过10年的Linux系统管理员经验(RedHat 和variants)。自2009年开始使用Zabbix进行监测和处理。且被Zabbix SIA授予专家认证。

Zabbix队列是观测Server/Proxy收集数据性能的最基本指标之一。但是队列中的数字往往较难理解,这里给大家举例子解释一下:

假设一个item的最后一次check时间点是11:05:00,其设置是每3分钟(180秒延迟)check一次,那么下一次的check时间应该是11:08:00。

然而事情往往并没有那么顺利(比如Zabbix Proxy宕了),item并没有准点在11:08:00进行check,如果已经11:09:10了,那么这个item就延迟了70秒,就会出现在队列【1分钟】这个一列。

如下图所示,在第5行中:

457个item延迟了5-10秒(x>=5 and x<10)

12个item延迟了10-30秒(x>=10 and x<30)

3个item延迟了1-5分钟 (x>=60 and x<300)

1个item延迟了5-10分钟 (x>=300 and x<600)

关于Zabbix队列,官网手册中内容如下:

手册内容链接:

https://www.zabbix.com/documentation/3.4/zh/manual/config/items/queue

概述

队列显示正在等待刷新的监控项。队列只是一个逻辑表达的数据。 Zabbix中没有IPC队列或任何其它队列机制。

由代理监控的监控项也包括在队列中 - 它们将被计入排队等待代理历史数据的更新周期。

只有具有预定刷新次数的监控项才会显示在队列中。这意味着以下监控项类型从队列中排除:

-- 日志、logrt和事件日志激活的Zabbix代理监控项

-- SNMP trap 监控项

-- trapper 监控项

-- web monitoring 监控项

队列显示的统计信息是Zabbix服务器性能是否健康的指标。

使用JSON协议直接从Zabbix服务器检索队列。 该信息仅在Zabbix服务器运行时可用。

读取队列

务器检索队列。 该信息仅在Zabbix服务器运行时可用。

要读取队列,请转到Administration → Queue。在右侧的下拉列表中选择Overview。

这里的图片通常是“绿色”,所以我们可以假设服务器运行的很好。

队列显示一个监控项等待5秒钟,还有5个监控项等待30秒。知道这些意味着什么是很棒的。

要做到这一点,请在右上角的下拉列表中选择Details。 现在,你可以看到这些延迟监控项的列表了。

有了这些细节,你有可能找出为什么这些监控项被延迟了。

有一个或两个延迟的监控项,也许没有任何可担心的原因。它们可能会在一秒钟内得到更新。 但是,如果你看到一些监控项延迟太久,可能会出现更严重的问题。

是不是监控代理宕了?

队列项

可以使用特殊的内部监控项zabbix [queue,<from>,<to>]来监视Zabbix中队列的运行的状况。它将返回延迟设定的时间量的监控项数量。有关更多信息,请参阅内部监控项。

作者其他博文

Backuping only the Zabbix Configuration

Zabbix配置备份

ZabbixZone Repository

ZabbixZone库

History Tables -- Housekeeper

历史时间表--Housekeeper

0 人点赞