Zabbix 创始人兼CEO Alexei Vladishev在Meetup上海站演讲
http://mpvideo.qpic.cn/0bf2dyaceaaahmajvsuhgrqfahwdeipaaiqa.f10002.mp4?dis_k=7ac3da3e0b95f99c5507e86d120b9896&dis_t=1621821275&spec_id=MzI3NTQ1ODEyMQ==1621821275&vid=wxv_1844067137221427200&format_id=10002&support_redirect=1
本文整理自Zabbix 创始人兼CEO Alexei Vladishev在2021Meetup上海站的演讲。更多演讲视频可关注官方Bilibili账号主页(ID:Zabbix中国)。深圳大会即将开启,敬请期待!
一、Zabbix5.4新功能
- PDF报告和可视化
- screens与仪表板已有的功能将会合并,支持多页面仪表板
- 为触发器、聚合及计算检查构建统一的且功能更强大的语法
- 用监控项标签替换监控项级别应用
- 支持API令牌,简化了Zabbix与第三方系统的集成
- 其他新特性
- 支持的硬件供应商列表
1. PDF报告和可视化
你还记得在Zabbix5.2中,我们已经实现了支持对自定义视图的预定义筛选。例如,在问题视图中,你可以使用不同筛选来创建不同类型的子视图。也就是说设置一个筛选可打开对应的视图,设置另一个筛选可打开另一个视图。
就像这个例子,我可以立即看到我的系统中有多少问题。而可能与服务相关的问题只有7个,高严重性的问题在另一个视图可查看。
2.Screens与仪表板已有的功能将会合并,支持多页面仪表板
Screens和仪表板的合并,在Zabbix的历史上,我们先有了screens,然后实现了对仪表板的支持,现在我们合并了screens和仪表板,以便用户更容易理解。我们具有多页面仪表板功能的仪表板,而不是只有screens和仪表板。
定期生成的pdf报告是我们向用户传递信息的另一种方式,您现在可以发送基于现有仪表板生成的pdf报告,而不连接到Zabbix UI。所以Zabbix做的是从仪表板生产一个文档,将它呈现为pdf格式,然后它将发送给用户。
如果你想每天或每周或每月得到这份报告,你可以定义什么时候生成这份报告,剩下的由Zabbix负责。好消息是设置了全新的用户角色功能,它将定义用户/客户是否有权限生成pdf报告。
3. 用监控项标签替换监控项级别应用
万物皆可标签。目前Zabbix已经支持模板、host原型和触发器的标签,唯一不支持标签的地方就是监控项。但从Zabbix5.4开始,监控项级别也支持标签了,实际上这意味着用监控项标签替换监控项应用集。因此,现在不再支持应用,我们在任何地方都使用标签,包括监控项。
请大家记住,标签是非常重要的,尤其对于问题来说。因为标签会给提供基础额外的信息 以快速解决问题,这样你可以立即看到问题发生在哪里,数据中心是什么,问题有多严重,是谁负责,是生产环境还是其他不同环境中的问题。所以这一切都非常重要,它确实给我们提供了更多的信息,让我们在系统中看到的问题的更加详细。
4. 为触发器、聚合及计算检查构建统一的且功能更强大的语法
另一个很重大的改进,也是我们在Zabbix5.4中所做的战略性改进。我们为触发器、聚合及计算检查构建统一的且功能更强大的语法。
目前,我们对触发器、计算项和聚合项使用了三种不同的语法。但显然Zabbix用户不太容易理解并搞不清楚上下文中应该使用什么语法。
但以后不会存在这样的问题了,从Zabbix5.4开始,我们为触发器和监控项构建新的统一语法,这是一种基本上统一的语法。我们对触发器、监控项和聚合项使用完全相同的语法。
第二个重要的事情是,我们基本上合并了计算和聚合检查的功能,因此未来将没有聚合检查,不再支持聚合类型的项, 现在它全部合并到计算检查中。另一个巨大的优点是现在聚合功能更加强大,所以可以用通配符来汇总聚合。
我们还可以对由主机组或主机标签筛选的一组监控项进行聚合,这种用于选择监控项的表达式可能非常复杂。我真的很喜欢这个功能。
实际上5.4版本已经推迟了发布,之所以发布有一点推迟,正是因为我们正在为触发器和监控项做统一语法的工作。这是我们真正想要包含在Zabbix5.4的重大功能之一。
5. 支持API令牌
Zabbix5.4还支持API令牌,命名为带有有效期的API令牌,因此任何用户如果在Zabbix中拥有权限,都可以创建API,并且使用此API令牌可用于Zabbix与其他系统的集成。
现在你可以只提供一个API令牌,而不需要用户名和密码就能使用API,这是一种更安全的与Zabbix API通信的方式。
6. 其他新特性
Zabbix5.4即将推出的另一组新特性是与可用性相关,是与全局脚本的统一相关。现在我们使用全局脚本来执行所有的事情,操作和Zabbix UI中的主机action。而且还有许多可扩展性改进。
第一个是断开轮询器与数据库的连接。那么轮询器不需要连接到数据库,我认为这对每个人来说都是个好消息。我们还支持趋势缓存以提高性能,因此如果你使用处理趋势数据的触发器函数,它们的工作速度会大大提高。
当proxy发送太多数据时,将支持优雅的安全启动方式。例如,当你升级Zabbix服务器时,可能会有5分钟10分钟甚至1小时的停机时间。当你启动Zabbix服务器时,proxy会向Zabbix server推送太多数据,导致 server很容易过载,但从Zabbix 5.4开始就不会这样了,Zabbix server会处理好这一问题。它将以非常好的方式分配负载,以确保Zabbix服务器不会过载。
我们还为JavaScript webhook和预处理进行本地XML解析。当我们使用XML服务时,它非常有用,并且我们想要从XML中获取数据。
我们还为JavaScript webhook和预处理进行本地XML解析。当我们使用XML服务时,它非常有用,并且我们想要从XML中获取数据。
新功能还有VMWare的集群监控,还有与不同类型的通知告警服务的其他集成,以及全新的监控模板:Hikvision、etcd、Hadoop、Zookeeper、kafka、AMQ等。
我们通常会持续支持新的集成,并持续支持更新的模板。在谈到可用性改进时,我们真的希望用户能够关注Zabbix UI,而不是点击从一个页面移动到另一个页面。
我们支持第三级菜单功能,这一变化真的让导航更简便。我们还支持某些操作的即时模式窗口,比如导入和导出,批量更新,这对用户来说更容易使用。
此外,还支持通过标签进行否定筛选的功能。标签在Zabbix中变得越来越重要,具有额外的筛选功能也是非常关键的。
还有什么?我们持续致力于提供监控和告警的官方解决方案,如果你想了解新的告警集成方案,欢迎访问Zabbix官网站查看。
7. 支持的硬件供应商列表
Zabbix5.4有我们所支持的硬件供应商列表,从Zabbix 5.4开始,我们将开发一个用于监控单个设备的模板,如Cisco、Juniper、APC及许多其他适用供应商的设备。我想会是在Zabbix6.0中发布,但目前已经在Zabbix5.4中开始了这项工作。
欢迎登陆Zabbix.com官网点击“集成”页面,你可以找到一个针对特定设备的模板,而不是针对设备范围或设备类别的模板。
众所周知,Zabbix可以在本地部署,我们确实支持在许多不同的操作系统上部署Zabbix。也可以部署在云端,如Azure、AWS、Kubernetes、Google云及中国的云上,比如阿里云,它也在我们的路线图中,我想短时间内就会推出。
二、Zabbix5.4战略方向及产品方向
如果你问我Zabbix 5.4什么时候发布,我没有一个确切的答案,我希望Zabbix5.4的第一个候选版本将在4月底发布,然后需要一到两周的时间来完成正式版。我希望Zabbix5.4正式版本在今年5月中旬发布。
现在让我们来谈谈一些战略方向。毋庸置疑,我们前进的主要方向就是为使用Zabbix的企业用户带来更多的价值。
- 1.支持应用性能监控跟踪
- 2.日志管理
- 3.安全性和合规性监控
- 4.终端用户综合监控
- 5.企业告警控制台
- 6.支持监控客户门户网站
- 7.SLA服务以服务树方式呈现
- 8.开箱即用的集成和监控
我相信我们需要支持应用性能监控跟踪,这也是很受用户和我们的合作伙伴欢迎的功能,它有助于使Zabbix成为一个真正的通用解决方案。这一解决方案还有助于监控应用程序达到非常详细的程度。
接着是日志管理, 目前Zabbix能够监控日志,但这个功能可能不够灵活,甚至可能无法扩展到可以监控来自Kubernetes集群或更大环境的所有日志(如C syslog)的工作流。因此,我们确实需要提高日志管理的可扩展性和灵活性。安全性和合规性监控也非常重要,尤其是当前许多公司渴望看到监控工具支持更多类型的安全相关监控。
终端用户综合监控是对web应用程序的监控,是能否创建一些复杂的场景的能力体现,用来测试和验证web应用程序是否也有良好的Javascript、前端、是否运行正常、操作良好。对于系统产生的众多故障信息使用企业告警控制台可以快速并灵活处理,它是一个将故障更可视化的工具,是我们应该提供给用户跟踪问题的工具。
此外,Zabbix将支持监控客户门户网站,这意味着Zabbix可用于那些监控自己客户的公司,如果你让你的客户访问监控数据,客户门户网站将启用此功能。
SLA服务以服务树方式呈现,可提供SLA、可用性、报告等数据。因此我们清楚地看到我们的服务是否已启动并运行,是否可用以及SLA是否与我们期望的服务相同。毋庸置疑,我们将继续研究开箱即用的集成和监控。
高可用性、可扩展性和负载平衡——特别是当我们谈论对更大环境的监控时,客户希望Zabbix的可扩展性足以监控数以百万计甚至数千万计的设备和服务。因此负载平衡的可扩展性问题是非常关键的。
我们也将继续提升Zabbix所有层面的灵活性。它将在数据收集上更加灵活,创建与其他系统的集成也更加灵活,并且在任务学习、问题检测、异常检测和相关技术等方面也更加灵活。
三、Zabbix6.0LTS路线图
现在让我们来谈谈Zabbix6.0。Zabbix6.0是LTS长期支持版本,因此决定将哪些内容包括在6.0中是非常谨慎的。LTS意味着它将支持5年,因此它必须要稳定,且非常一致,我期待Zabbix6.0 LTS将在今年底发布。那么Zabbix6.0LTS版本有什么规划呢?
- 事件关联和企业告警台
- SLA监控
- 机器学习,基线监控
- 高可用性和负载均衡能力
- 云、K8S、供应商监控
- 可视化及报告
- 包含所有操作的审核日志
- 显著的可用性改进
事件关联和企业告警台, SLA监控, 这将为Zabbix带来很大的改进。机器学习,基线监控。一旦实现了这个功能,能基于历史数据的分析自动设定阈值,不再需要手动调整设置,Zabbix可以用一些机器学习技术自动执行此操作。
高可用性和负载均衡能力也是非常重要的。Kubernetes云监控和供应商设备监控。可视化和报表。我们通过新的小组件来提高Zabbix的可视化能力,比如报表管理和容量测算等。
在Zabbix6.0中,我们计划支持审核日志,它基本上记录所有配置更改,基本上所有用户操作都会记录在审核日志中。
同时我还希望改进一些非常重要的可用功能,使Zabbix成为一个更容易使用的产品,不仅原有用户可以有良好体验,而且让新用户也更容易使用。
现在我们来聊聊事件关联。该主题对于大型环境尤其重要,例如Zabbix每秒可以生成数千个事件。我们确实需要明白什么事件是重要的,什么事件不那么重要,这就是为什么我们要引入一个相关引擎,它能把执行事件筛选、去重,并根据来自其他资源(如配置管理工具或资产管理工具)的数据进行事件丰富。
显然,事件关联引擎的主要思想是简化根因分析,这样就可以清楚地看到所有问题的根本原因是什么。同时支持影响分析,这样就可以了解如果存在此问题,这个问题会影响到哪些服务,这也非常重要。
我们有很多事件,而所有这些事件都要进入事件关联引擎,我们就只需要看到事件关联引擎输出的重要事件。
企业告警台是关于减少噪音的,是关于隐藏依赖的问题,是关于中止隐藏我们不感兴趣的问题。告警控制台或问题视图需要优化以达到更快解决问题和协同工作的效果。
有时你可能会在告警控制台中看到成百上千的事件,但我们确实需要有多种方法来管理它们确保只看到关键的事情。我们想看到所有这些问题的根源而不是次要事件。
可用性、性能和可扩展性。在Zabbix5.2中,我们已经支持Zabbix UI和API组件水平扩展,这是可扩展性问题中非常重要的一部分。在Zabbix5.4中,将支持用于历史存储的API,这样就可以将历史数据保存在不同的存储中。
同时还支持proxy高可用性和负载平衡,对接zabbix server,也就是说你可以拥有一组proxy来监控一组设备或服务。如果一个proxy不可用了,不用担心,因为负载将均匀分布在当前可用的proxy上。
四、Zabbix6.2、6.4及7.0路线图
Zabbix6.2预计在2022年的第二季度发布。
- 最终用户能够进行综合监控
- 安全监控和合规性监控
- 客户门户网站支持重命名
- 支持Zabbix用于多数据中心场景
- 可视化监控
- 开箱即用监控和集成
在Zabbix6.2中,我期待最终用户能够进行综合监控,用于对不同应用程序进行良好的开箱即用的监控方式。我也期待安全监控和合规性监控到位。
我期待客户门户网站可以有重命名的选项,如果你是一个独立的公司,你可以把Zabbix重新命名,让你的客户看到这是你的品牌的解决方案,而不是Zabbix的。
另一个非常重要的功能是支持Zabbix用于多数据中心场景,一方面可以集中式监控,另一方面也可以分散式监控多个数据中心。因此,如果一个数据中心因某种原因不可用,Zabbix仍可继续在数据中心内独立工作,包括告警、可视化等,所有其他数据中心的所有监控也将继续工作。当然我们将继续致力于可视化和可用性改进,以及开箱即用的监控和告警。
Zabbix6.4预计于明年年底发布。我介绍一些重要的特性,比如APM和跟踪,从日志管理等其他系统接收事件的能力 。这是一个非常重要的功能。关于日志管理,尤其是APM和跟踪,意味着我们必须引入一些库或框架,这样Zabbix监控功能就可以包含在第三方,如java,python,javascript或php应用程序中。可视化可用性改进,开箱即用的监控和集成将会继续研究。
Zabbix 7.0 LTS将 于2023年第二季度发布,届时我希望看到Zabbix是一个真正的云原生,具有高可用性和可扩展性的可扩展应用程序 ,它可以水平扩展所有Zabbix组件。
此外,再介绍一种类似于监控和数据采集的可视化(SCADA,Supervisory Control And Data Acquisition监控和数据采集),秒级可视化是其中之一,后续Zabbix UI会实现这一需求。它也帮助我们进入SCADA市场。
最后,就在一周前我们更新了Zabbix路线图,在Zabbix官方上包含了关于Zabbix5.4,6.0,6.2,6.4和7.0版本的信息。它包含跳转到相应问题的链接,这样你就可以跟踪开发进展,你也可以从仪表板上看到每个特性的状态,欢迎大家到官网上看一看。这是一个非常详细和最新的路线图,你现在就可以使用它。