本文整理自Zabbix创始人Alexei 在2021Zabbix中国峰会关于Zabbix6.0的演讲及3个精彩问答。
点击跳转至B站观看完整视频
Zabbix6.0LTS - 监控领域又一大飞跃
目录
1.数字化转型的旅程
2.基础架构监控的挑战
3.Zabbix – 通用开源企业级解决方案
3.1.成本效益
3.2.任意环境部署
3.3.监控任何对象
3.4.监控Kubernetes和混合云
3.5.数据采集和聚合
3.6.全面的安全性
3.7.MSP的强大解决方案
3.8.可伸缩性和高可用性
3.9.机器学习和统计分析
3.10.为用户提供更多价值
3.11.新的可视化功能
3.12.物联网监控
3.13.基础设施代码化
3.14.标签分类
4.未来发展
4.1.高级事件关联引擎
4.2.多数据中心监控
4.3.Zabbix 6.0-7.0版本发布时间
4.4.Zabbix路线图
采访精彩回顾
1
问:你认为用户从Zabbix 5.0/4.0或更老的版本迁移到6.0 LTS的主要好处是什么?
答:我认为Zabbix 6.0 LTS是一个非常不同的产品——即使你将它与相对较新的Zabbix 5.0 LTS进行比较。它有许多改进。例如,业务服务监控为企业客户提供了巨大的附加价值。
通过使用新的触发器语法和与异常检测和基线监控相关的新函数,我们的用户可以从监控工具中已经拥有的数据中获得更多信息。
新的可视化选项——多个新的小部件、地理地图、定期PDF报告——为我们的终端用户和他们的客户提供了大量的附加价值。
2
问:有没有计划对Zabbix DB的后端做些改变——让它更具可扩展性,或者完全重新设计?
答:现在我们把所有的信息都保存在一个关系数据库中,比如MySQL或PostgreSQL。我们增加了对TimescaleDB的支持,这给我们的用户带来了一些巨大的优势,这要感谢改进的数据存储和性能效率。
但是我们仍然有一些用户希望将不同的存储引擎连接到Zabbix上——也许是为了保存时间序列数据而特别优化的。实际上,这已经在路线图上了。我们的计划是为历史数据引入一个统一的API,这样如果你想附加你自己的存储,我们只需要部署一个插件,既可以与我们的历史API通信,也可以与你选择的存储引擎通信。这个特性即将到来,并且已经出现在我们的路线图中。
3
问:你个人最喜欢的功能是什么?你百分百希望看到在Zabbix 6.0 LTS中实现的东西?
答:我认为Zabbix 6.0 LTS是Zabbix 5.2、5.4以及Zabbix 6.0 LTS中直接引入的特性的组合。就个人而言,我认为Zabbix 6.0 LTS中我最喜欢的特性是组成最新的异常检测实现的特性。
在探索更先进的机器学习和统计分析功能方面,我们还处于起步阶段,但我非常肯定,Zabbix的每一个新版本都会出现与机器学习、异常检测和趋势预测相关的新功能。
这可以为Zabbix提供一种与用户分享见解的方式。分析您的系统发生了什么,系统中的指标如何运行。
以下为演讲正文。
数字化转型的旅程
如今,许多大型公司都在积极参与数字化转型。当他们想迁移现有基础设施以使其更好、更灵活和更具成本效益时,Zabbix显然可以成为他们数字化转型的重要组成部分。
面对数字化转型时会有以下几种挑战。
首先,对遗留和现有系统进行管理。我们想创造出更有突破性的产品。此外,我们必须支持较旧的技术和较新的技术和协议。
其次,许多公司都在考虑向一个新的平台过渡,从混合云到k8s和openshift,我们将看到Zabbix在这一过程中起到怎样的帮助。
第三,可扩展性和高可用性也扮演着非常非常重要的角色。特别是在今天,监控越来越多的设备,网络变得越来越复杂。随着云、服务监控、容器监控的兴起,可扩展性和高可用性的重要性不言而喻,如同安全性一样。
第四,就是来自日益凸显的安全性的挑战。
最后的挑战当然是需要考虑预算问题,尽管我们都想IT基础架构变得更好、更敏捷。
基础架构监控的挑战
IT基础架构监控的挑战中有几点值得一提。
首先,依然强调可扩展性和高可用性。随着设备数量更多,云资源更加复杂,还有一些硬件设备,使得监控的挑战性更大。我们希望能在单一界面管理平台展示整个基础设施。
其次,当不同的供应商为不同的技术和不同类型的应用程序和服务提供自己的监控解决方案时,我们意识到多种工具带来的问题,由此可见集中化监控亟待解决。因此我们缺少的是一个单一界面管理平台,集中化监控能真正帮助您解答关于监控最重要的问题。
第三,我们都想充分利用监控工具采集到的数据。所以从采集的数据中获得更多的价值也是非常非常重要的。
最后,集中式可视化和报表也是现代监控解决方案的一个非常重要的部分。
Zabbix – 通用开源企业级解决方案
Zabbix是一款通用、免费、开源的企业级监控解决方案。
一方面,Zabbix的所有功能都是免费的,因为我们只有一款产品,包含了所有现代监控功能,同时也为未来做好了准备。
另一方面,Zabbix是一款通用的解决方案,它是“通用的”。因为我们不关注特定类型的客户或特定规模的基础设施。Zabbix可用于中小型企业,也可用于基础设施遍布全球的大型跨国公司。我们不仅专注于监控特定的技术领域,如性能监控或服务器监控或应用程序监控。Zabbix具有足够的灵活性和通用性,可以全栈监控从硬件层到最上层业务服务的整个IT基础架构。
Zabbix是免费的和开源的,也就是说我们还免费提供所有企业级监控功能,包括双因素身份验证、单点登录、采集任何数据的能力,而不受监控设备或服务数量的限制,如监控设备的数量、监控服务的数量和您想要保留在Zabbix数据库中的数据量。与市场上的其他工具相比,这是Zabbix的一大优势。
- 成本效益
说到数字化转型,成本效益非常重要。Zabbix提供了极低的总拥有成本(TCO)。
主要体现在以下几方面:
首先,再次强调,Zabbix是免费和开源的,而且它是一款高质量的产品。实际上,我们在产品的质量和安全方面投入了大量资金和精力。
其次,Zabbix有可靠的供应商和专业的商业服务作为后盾。所以,你们可以从这两个世界中得到最好的东西:一是开源免费的自由,二是专业技术支持,来自遍布全球的供应商或合作伙伴网络的商业支持,能满足客户7*24小时全天候全球支持的需求。
第三,对受监控设备的数量没有限制,对想要使用Zabbix的用户数量没有限制,完全不受限。
第四,当然由于Zabbix是开源免费的,我们还免费提供了所有关于Zabbix的信息,比如操作文档、使用指南和博文、社区资源、视频等等。
最后,使用Zabbix的另一个重要方面是,由于Zabbix是最受欢迎的解决方案之一,它目前在市场上非常流行,雇佣和找到Zabbix工程师非常容易,可以使您的团队更加强大,成本完全在您的控制之下。即便您使用我们的商业服务,这通常只是固定价格协议。
- 任意环境部署
Zabbix可以部署在任何地方,真的是任何你想部署的地方。
本地部署,可以在RedHat或SUSE上,在Kubernetes或OpenShift集群中快速部署,用预安装的Zabbix在docker容器中部署,或者许多其它支持的操作系统。
您可以选择在本地部署Zabbix,也可以在云上部署Zabbix。实际上,我们支持在AWS、Azure、Google云、OpenStack、OpenShift、Kubernetes和许多其它云一键部署Zabbix。
- 监控任何对象
使用Zabbix,您还可以监控任何对象。
有了Zabbix,你可以监控任何东西。如果您有一些遗留系统,那么很有可能其他人,例如社区成员,已经知道如何将这些设备连接到Zabbix,或者我们可能已经有了可用的官方解决方案。
因此,Zabbix基本上就是能监控你的由旧技术或现代技术组成的基础设施的答案。
访问https://zabbix.com/integrations页面,可以查看数百甚至数千开箱即用的Zabbix监控解决方案。因此,Zabbix可以监控不同的应用程序、服务、网络设备、物理设备和物联网设备等。
您还可以将Zabbix与现有系统集成,例如工单系统,如Jira、OTRS、Zendesk、Redmine、BMC、ServiceNow、HP enterprise、IBM等的解决方案。告警也是监控系统的一个重要组成部分,我们支持与Slack、Discord、Pushover、Microsoft team等解决方案的开箱即用集成。
我们最近为市场上已经存在的集成引入了高级搜索功能。访问https://zabbix.com/integrations页面,您可以找到许多解决方案,例如,HPE的解决方案,你可以看到官方解决方案列表,同时下面也能看到由Zabbix社区成员、用户、合作伙伴和客户提供的不同的解决方案的列表。
- 监控Kubernetes和混合云
目前对Kubernetes和OpenShift的监控是两大热门话题。许多公司正在考虑将现有的基础设施转移到OpenShift、Kubernetes或一些云平台,如AWS、Azure、Google云等。
很高兴地告诉大家,从Zabbix 6.0开始,我们提供了OpenShift和Kubernetes集群的开箱即用监控。
- 数据采集和聚合
接下来特别介绍一些使Zabbix更加灵活的特性。
第一个特性是数据采集,综合监控(多步骤)。这是一项一年前推出的功能,它已经受到我们用户的欢迎。它是关于通过http协议监控不同的设备。使用综合监控,Zabbix可以用非常简单直接的方式与不同的API进行通信,如云API和Kubernetes或OpenShift API,这些API采集数据,然后以非常高效的方式处理这些数据。
另一个不错的特性是数据聚合,于2021年初推出,适用几乎所有内容的通用新语法。这是触发器表达式的一种新语法,所以现在我们可以用更简单的方式定义问题条件。另一方面,我们也可以使用完全相同的语法进行复杂的数据聚合。它还有助于监控Kubernetes和不同的云技术。新语法非常强大,而且与旧语法相比,它更易于使用。
- 全面的安全性
显然,安全性是当今的热门话题,许多公司都在关注安全性和数据保护。我非常自豪地告诉大家,Zabbix在开发和使用以及最佳实践方面遵循最高最严格的安全标准。
Zabbix从设计上就确保安全,在这张图中,你可以看到不同的模型和互连部件,如Zabbix Agent、Zabbix Server、Zabbix Proxy、Zabbix前端。
所有Zabbix组件之间的所有通信都使用强协议和强加密(如TLS)进行加密。
部署Zabbix Agent时,它从不需要root访问权限或其他特权。您可以在普通用户下运行Zabbix Agent,您可以告诉Zabbix Agent只执行一组特定的指标,它就不会再多做其他事。例如,只监控一个日志文件或者CPU使用率。在这种情况下,Zabbix Agent不会返回任何其它指标,这是非常安全和可靠的。
早在今年上半年,Zabbix和数据库之间就引入了加密技术,这也使Zabbix更加安全。我们对传输层上的所有通信进行加密。
Zabbix前端支持双因素身份验证、单点登录、密码复杂度检查,这是Zabbix 6.0中的一项新功能,以及新的、更全面的审计日志,这意味着Zabbix用户通过API调用或Zabbix Server本身所做的所有操作和配置更改都记录在审计日志中。Zabbix遵循最高标准。
除此以外,所有机密和敏感信息,如密码、API令牌、用户名、机密API端点都可以存储在外部Vault,例如HashiCorp Vault或CyberArc产品(该对象将于Zabbix6.2支持)。
不久前,我们引入了对API令牌的支持,以安全访问Zabbix API。Zabbix API也很重要,因为使用Zabbix API,我们可以将Zabbix与企业中正在使用的系统集成,例如工单系统或自动化解决方案。如果你想使用Zabbix实现一些自动化,可以使用Zabbix API。用于API访问的安全令牌使事情变得更好。
最近推出的另一个友好且强大的改进是对用户权限的精细管理控制。早在今年初,我们就在Zabbix 5.2或5.4中引入了对用户角色的支持,现在,您可以为不同的用户角色和不同的用户分配完全不同类型的权限、用户权限和特权。
现在可以非常精细地配置用户角色。我们可以定义某个用户角色可以访问Zabbix UI的某些部分,例如,仅访问仪表盘。我们还可以指定特定用户角色可以使用哪些API方法和UI操作,这是强有力的功能。
- MSP的强大解决方案
所有这些功能为MSP(管理服务提供商)客户创建了一个非常强大的组合和解决方案。
实际上MSP可以使用Zabbix作为增值服务,他们可以为客户提供监控服务,并从中获得额外收入。
可以构建一个客户门户,它是以下各项的组合:仪表盘和自定义UI只读访问的用户角色,在Zabbix 6.0中会推出的re-branding选项,SLA报表,定时报表。Zabbix可以生成日报、周报、月报发送给客户,并获取一定的报酬。现在,Zabbix正成为MSP客户非常友好和强大的解决方案。
- 可伸缩性和高可用性
可扩展性和高可用性是当今非常重要的话题。随着设备数量的不断增加,网络变得更加复杂,同时随着向混合云的过渡,设备的数量不断增加。
Zabbix提供HA选项和负载均衡Zabbix UI和Zabbix API。为了扩展前端或API,我们只需启动额外的节点,使Zabbix工作得更快,同时推出冗余和更高级别的高可用性。
除此以外,Zabbix 6.0为Zabbix Server提供了高可用性的本地支持,因此我们可以基本上部署一个Zabbix Server高可用集群。在这种情况下,如果活动节点因任何原因停机,Zabbix将自动切换到备用节点。这是一个零停机切换。Zabbix高可用集群最棒的地方在于它易于使用,而且真正启动和运行只需五分钟。
我们计划将Zabbix打造成一个具有可扩展性和内置高可用的的云原生产品。目前,我们为UI和API实现了高可用和负载均衡。现在我们为Zabbix Server提供了一个HA选项。
路线图的下一步就是对不同时间序列后端支持历史API,以提高效率和可扩展性。另一件我们将来要实现的事情是Proxy和Server的负载均衡功能。
所有这些特性的结合将使Zabbix成为一个真正的云原生应用程序,具有无限的水平可扩展性。
- 机器学习和统计分析
我们知道定义一些问题条件非常容易,比如“可用磁盘空间小于10%”,即磁盘空间即将用尽,或者可能是每秒的事务进程数低于某个数。这是基于阈值的问题条件,但有时它的扩展性不太好。
我们想从Zabbix采集的数据中得到更多的信息,Zabbix的告警非常好用,比如“新用户注册数量仅为上周的12%”。通过使用异常检测,Zabbix能够生成告警,如“每日带宽使用率异常”或例如“每周CPU使用率异常”。
目前,Zabbix提供了非常强大的异常检测功能。它都是基于基线和异常检测函数,并有季度的支持,也有扩展的一组函数用于趋势分析和趋势预测。这是如何从Zabbix采集的数据中获得更多信息,并且如何从监控工具中获得更多的见解的又一种方式。
- 为用户提供更多价值
说到价值,当我想到Zabbix的新方向、Zabbix路线图时,主要的问题是如何为我们的用户提供更多的价值?当然,主要关注点是企业用户
在Zabbix6.0中,我们重新设计了业务服务监控(BSM)。我们在Zabbix可视化上迈出了一大步,不仅仅是为了基础设施,包括服务器、网络设备、不同类型的应用程序和低级别服务的监控。
但现在都是关于商业服务监控,即提供给终端用户和企业内部用户的服务。
所以Zabbix 6.0将实现对复杂服务级别目标(SLO)定义的支持。它提供了一个实时SLA报表。除此之外,它还提供多租户选项和告警选项,以及根因和影响分析。因此,对于那些希望更多地了解业务服务监控的用户来说,这确实是一个巨大的改进。
- 新的可视化功能
众所周知,数据是有用的,有更多数据有时甚至更好,但我们需要用一种好理解的方式表现它。这就是为什么我们要投入如此多的时间和精力来改善可视化功能。
在Zabbix6.0中,我们推出了地理环境拓扑图的支持。还推出了其它小构件,如Top N报表构件,而且提供模板化和多页的仪表盘。这一切都使Zabbix更好地可视化并让Zabbix为你提供更强大的价值。
PDF定时报表,这是2021年初推出的功能,让仪表盘功能更加强大。现在,仪表盘不仅可以用于实时报表,还可以用于长期报表,从而为用户提供更多价值,因为可以生成日报、周报、月报和年报,并将其发送给Zabbix用户或我们的客户,如果你是MSP类型的Zabbix用户。
- 物联网监控
Zabbix主要负责IT基础设施监控,但我们将Zabbix的监控范围进行扩展,一是环境监控,如温度和湿度监控。二是通过modbus和MQTT协议监控IoT物联网设备。
所以现在监控工厂设备、管理系统、loT网关、来自不同传感器和硬件设备都是可以的。
再次强调,这一切都是与我们的单一界面管理平台有关,因为我们确实希望使Zabbix尽可能通用,成为你IT基础架构的核心部分。
- 基础设施代码化
基础设施代码化是如今的另一热点话题。有时候我们真的想让我们的基础设施成为一个文本,实际上是一本书。然后根据这个文本自动构建我们的基础设施。
不久前,我们将所有模板从JSON格式转换为YAML格式。现在,将Zabbix模板保存在git存储库中也是可以的。然后使用CI/CD,你可以将这些模板自动应用到基础架构中。
它还创建了一个非常强大的组合,当存储库中模板变更、版本化并且通过CI/CD应用于监控中。
- 标签分类
现在Zabbix的标签作为所有对象,为指标、触发器、主机、网络设备和业务服务分类,然后用于告警、仪表盘过滤和报表,因此标签可以作为所有对象。就在最近,在Zabbix 5.4中我们把应用集转换为标签,这些都使Zabbix变得更加灵活。
未来发展
你可能会问,Zabbix未来发展的主要方向有哪些?
首先,我们会继续在通用性上投入。众所周知,Zabbix是一款由专业人士为专业用途而制作的专业工具,同时我们想使Zabbix尽可能更加易用。所以,在前端、可用性和用户体验方面的改进有望很快实现。
其次,会继续在Zabbix的可视化和报表功能上投入。这也变得非常非常重要。单一界面管理平台意味着我们想要所有被监控工具采集的数据向我们展示环境中正在发生什么,以及面临的问题的根本原因是什么。此外,这是充分利用Zabbix采集的数据的另一种方式。
第三点,事件和问题的管理和处理也是非常非常重要的话题。
第四点是扩大监控范围,这是我刚才也提到的内容。将会扩展到合规监控,应用程序性能监控,这一功能即将推出,高级日志监控,并使它变得更强大和更全面一些,以及公有云、私有云和混合云监控,尤其在当今他们也同样非常重要。
当然,我们想确保Zabbix在所有级别都是可扩展的。这里指的是不同类型的插件、Webhook和UI模块。一些特性现在已经能支持了,另一些特点未来很快也能支持。
高可用性、可扩展性和负载均衡非常非常重要,并且继续确保Zabbix在未来成为一个云原生应用。
- 高级事件关联引擎
对于监控工具而言,高级事件处理是一个非常重要的主题,为什么?因为在大多数情况下,我们关注的是指标,指标的数量。我们采集了多少指标,从这些指标中获得了多少价值?
但我认为,在监控大规模环境时,事件的数量是非常重要的,我们需要保持控制和管理来自不同系统的不断增加的不同事件的数量。这就是为什么现在减少噪音非常重要。
我们需要进行根本原因分析,这样优先级较低的事件就不会分散我们对更重要事件的注意力。因此,预计Zabbix未来将引入一些高级事件关联模型,能够筛选事件,消除重复事件,并借助事件关联模型进行事件丰富,从而更好地进行根因分析。
- 多数据中心监控
现在我们可以在Zabbix中使用基于Proxy的分布式监控来完成多数据中心监控。然而,有些时候我们需要Zabbix Server,因此对不同数据中心的监控更加独立。
当我们在一个数据中心拥有Zabbix Server,另外的Zabbix Server在另外一个数据中心时,所有的服务器都报告到一个单独的位置,这将确保集中事件的处理、可视化和报表或最终数据和集中化的仪表盘。所以,多数据中心监控也即将到来。
- Zabbix新版本发布时间
最后的内容肯定也是你最关心的
——Zabbix6.0什么时候会发布?
我们计划Zabbix 6.0在明年即2022年1月推出。
接着Zabbix6.2在2022年第2季度,Zabbix6.4计划在2022年第4季度发布。
而Zabbix 7.0计划在2023第2季度发布。
- Zabbix路线图
如果你想紧密关注Zabbix的发展,我们准备了专门的页面:Zabbix路线图(https://zabbix.com/roadmap),在这里你可以看到关于Zabbix 6.2、6.4和7.0的最新计划内容,你还可以看到关于Zabbix 6.0功能开发的最新信息。