慕尼黑运输集团(MVG)是水、电、天然气、交通服务的综合提供商,该公司为成千上万的慕尼黑本地居民和游客提供日常保障服务:检测、排查、预防问题,和尽快高效的解决问题。
在此特别致谢:本次项目的成功实施归功于Zabbix德国区认证合作伙伴IntelliTrend IT-Services GmbH和其实施工程师Wolfgang Alper,目前Zabbix不仅用在MVG IT基础架构监控,也监控和控制着电车和地铁的站台和行车情况。
1
概述
一 客户痛点
最大的挑战是要找到一个工具,可以提供实时可靠的问题检测,来监控移动车辆组件的状态,在特定的时间段,车辆可能处于盲区,这意味着必须开发某种逻辑来检查设备是暂时不可用还是有缺陷。
当设备数量,或者环境复杂度和规模都升级到新的Level时,就会出现一些关键的问题,客户现有的监控系统达到极限,没法再扩展。除此之外,客户需要更详细准确的诊断数据以获得更精细的错误分析
一 客户要求
该监控解决方案需要能和大量不同的protocols或者厂商设备兼容,也需要提供一个可扩展的脚本环境,最后很重要的是需要支持数据可视化。
一 解决方案
Zabbix监控车辆内部的网络组件和视频组件等等,提供安全、可靠的视频监控
一 项目成果
在实施Zabbix之后,发现了许多问题,这些问题在之前的监控解决方案中没有检测到。现在,直接从UI访问相关设备,可以更快地识别故障并立即修复。此外,通过一些外部脚本,可以简化工作流程并在Zabbix Maps中添加多个适合的功能
MVG选择使用Zabbix的原因:
- 支持多种protocols,可以监控不同厂商的不同设备
- 通过脚本实现可扩展性
- 高度数据可视化
- 可扩展性高
- 无代理监控
- 功能分离:数据收集,数据评估,问题识别和警报
- 用户社区强大
- 强大的API功能
"当要监控的设备的数量和复杂性以及由此产生的额外成本变得过高时,2015年MVG开始寻找新的监控解决方案。在(挑战)开始时,我们对多种监控方案进行了调查和测试,但由于缺乏灵活性和可扩展性,没有进一步的跟进。更重要的是,这些工具无法提供移动车辆中组件的可靠错误检测。
由于Zabbix的设计,特别是 “items”和“ triggers”的划分,通过触发条件内的单独逻辑模式,可以满足这一特定要求。
由于组件的高度同质性,我们寻求可以通过模板增强可管理性的解决方案。同样也需要满足简单集成外部脚本的要求。所有这些功能的要求,以及Zabbix背后的强大社区,都是我们最终选择Zabbix的原因。“Sandro Gehlhaar,网络和系统管理员。
2
具体实施
目前,Zabbix server监控的设备有3796个,而后者包含MySQL数据库和Web前端。该服务器虚拟操作,有8个CPU和32GB RAM,由SAS存储系统支持。
Zabbix server在这些设备中查询105818个监控项,检测23820个触发器,来监控&判断特定监控项是否偏离正常值。平均接近298.48 的每秒新值,7人同时使用系统。概况如下:
- 电车/地铁内的每个设备都被定义为主机,并监控其可用性
- 每个电车/地铁被定义为主机组进行管理
- 主机组由电车/地铁线路嵌套和组织(使用Zabbix 3.2中引入的主机组嵌套功能)
- 所有设备都依赖于MRCU(地铁中的移动无线电控制单元)或LTE路由器(有轨电车中的LTE G4连接)的连接性
- 为每个电车/地铁自动创建Maps(使用Zabbix API)
- Maps使用sub-maps链接到特定的电车/地铁视图
以下示例中的Zabbix maps 将每个地铁显示为主机组展示其状态:
每个电车/地铁的详细Zabbix地图显示组件及其状态
点击map – 安装点菜单栏执行的操作:
直接从Zabbix地图显示设备在有轨电车/地铁中的安装点
点击map –车辆位置的菜单栏执行的操作:
电车位置直接显示在Zabbix map上