Zabbix监控docker
2013年开始使用Zabbix,2014-2016年负责Zabbix二次开发及架构设计,目前从事PaaS平台及微服务的开发和运维工作,Zabbix实践爱好者,Cactifans作者,golang爱好者
以前使用cadvisor监控Docker容器状态,最近看到可以使用Zabbix Module的方式,通过部署一个zabbix agent的docker容器来监控宿主机器和宿主机器上docker的状态。
点击查看原文
使用Zabbix Agent Docker进行监控
在需要监控的宿主机器上运行运行Agent容器
1 docker run
2 --name=dockbix-agent-xxl
3 --net=host
4 --privileged
5 -v /:/rootfs
6 -v /var/run:/var/run
7 --restart unless-stopped
8 -e "ZA_Server=192.168.0.252"
9 -e "ZA_ServerActive=192.168.0.252"
10 -d hub.c.163.com/canghai809/dockbix-agent-xxl-limited:latest
192.168.0.252为已经安装好的zabbix server的ip地址。具体根据自身情况修改,最好填写IP地址。由于Docker官方的hub在国内下载较慢,我已同步到网易蜂巢镜像,提供多个版本主要为Zabbix Agent版本区别和Docker API版本区别。
Agent不同版本镜像
1 docker pull hub.c.163.com/canghai809/dockbix-agent-xxl-limited:latest
2 docker pull hub.c.163.com/canghai809/dockbix-agent-xxl-limited:3.2-2
3 docker pull hub.c.163.com/canghai809/dockbix-agent-xxl-limited:3.2-1
运行之后,使用
1 docker logs -f xxxxx
xxxx为刚运行容器的id。查看日志,确认运行正常。
使用Zabbix模块方式进行监控
如果不想使用Agent的Dcoker镜像来监控,可以直接在Agent上通过加载Zabbix Module的方式监控,添加模版即可。 Zabbix Docker module下载
OS
for Zabbix 3.4
for Zabbix 3.2
for Zabbix 3.0
CentOS 7
Download
Download
Download
CentOS 6
Download
Download
Download
下载对应的版本之后,在Agent配置文件里添加载模块
1 LoadModulePath=/usr/local/lib/zabbix/agent/
2 LoadModule=zabbix_module_docker.so
注意模块路径,按照自己的实际路径修改。并重启agent,之后在zabbix里添加主机,关联docker模版即可.
Zabbix Server配置
在zabbix server上导入监控docker的模版,一共2个模版,下载后解压
点击下载
我使用主动模式,因此导入Zabbix-Template-App-Docker-active.xml 这个模版
在zabbix server里添加主机
这里的机器名为使用hostname命令查到的机器名。关联Linux OS 模版和Zabbix-Template-App-Docker-active
大概10分钟左右就可以看到监控效果
目前监控指标比较基本。提供了其余的监控指标,可以点击查看具体使用方法。
Debug
如出现无法监控的现象,有可能是Docker版本差异.可使用如下命令查看模块是否工作正常
1 zabbix_get -s 192.168.0.120 -k docker.discovery
192.168.0.120为被监控端ip,可看到类似如下返回,表示Docker监控模块工作正常
1 {
2 "data": [
3 {
4 "{#FCONTAINERID}": "b173b9671ea305648cb15704ce2086724578c113a65bec4724df0461e894a423",
5 "{#HCONTAINERID}": "b173b9671ea3",
6 "{#SCONTAINERID}": "b173b9671ea3",
7 "{#SYSTEM.HOSTNAME}": "localhost.localdomain"
8 },
9 {
10 "{#FCONTAINERID}": "fcae1c7a27f07367315de2c381bd630f1fe0e9680844074bf2c931fad5011afd",
11 "{#HCONTAINERID}": "fcae1c7a27f0",
12 "{#SCONTAINERID}": "fcae1c7a27f0",
13 "{#SYSTEM.HOSTNAME}": "localhost.localdomain"
14 }
15 ]
16 }
默认模版里为使用{#HCONTAINERID}为容器标签,如出现不支持或日志中出现如下
1 Cannot open metric file: '/sys/fs/cgroup/memory/docker/fcae1c7a27f0/memory.stat'
可将模版里的{#HCONTAINERID}变量替换为{#FCONTAINERID}即可监控