11月9日,在CDCC主办的2022年数据中心行业峰会上,腾讯数据中心以“超大规模数据中心集群-智能化运营管理技术”斩获科技成果奖一等奖。科技成果奖素有“IDC行业诺贝尔奖”之称,是为奖励数据中心先进科学技术和创新研发所设置的行业重大奖项。此次的获奖技术是腾讯基于多年运营实践经验提炼出的突破性成果,融合了大量数据中心行业的首创技术和交叉学科知识,不仅实现了超大规模集群的高效、高可靠和低成本管理,也为腾讯的自动化运营道路提供了超强助力。
技术介绍视频
一 趋势:海量与自动化不可逆转
数据中心正朝着海量与大规模集群演变。作为支撑大型业务的载体,超大规模数据中心集群具有体量大、分布广、多种技术架构并存、需要协调一致的服务等特征,这也为集群的管理带来了不可估量的难度与挑战。
超大规模数据中心集群拥有数量庞大的机房,如果缺乏有效的管理机制,将难以应对相伴而生的大量机房问题。同时,各数据中心分布广泛,具有显著的差异化特质,针对每个园区的个性化的管理会使运维效率低下。此外,传统的管理方式需要为每个园区配备大量的人力和专门的自动化运维管理平台,这也将带来管理成本上的巨大消耗。
腾讯数据中心集群
二 探索:智能化技术与自动化运营
超大规模集群是数据中心发展的必然趋势之一,而自动化运营则是应对集群挑战的破局之道。腾讯数据中心早在十多年前就预感到了这一趋势,并在不断的实践钻研中,探索着实现自动化运营的技术手段。经过多年研究和实践,提炼出“超大规模数据中心集群智能化运营管理技术。”
这项技术是腾讯在国家数字经济建设的背景下、针对超大规模数据中心集群研发的“智能化运营管理方案”。它管理范围大、覆盖面广,融合了动环、物模型、BPM、AI节能等大量行业首创的突破性技术和交叉学科知识,具有极高的融合性、复杂性和领先性,有效应对了超大规模数据中心集群管理的质量、效率和成本挑战。
01
IDCDB 物模型:
构建统一集中化管理的基础
抹平集群内各数据中心的差异是统一集中管理的基础。基于此,腾讯通过IDCDB技术对不同类型的数据中心从物理空间、设备、资源、人员和业务等维度进行了高度抽象建模。通过物模型技术建立起每个设备的数字孪生体,从而反映出设备的参数、特性和相互关系。IDCDB与物模型相辅相成,实现了异构数据中心的标准化,使不同类型的数据中心能够快速接入到智能化运营平台,为超大规模数中心集群奠定了统一集中化管理的基础。
02
云、边、端协同架构:
实现运维效率最大化
高质、高效、低成本是统一集中管理的目标。本技术通过云边端协同架构,为超大规模数据中心集群的智能化运营提供了高效可靠的系统环境,实现了海量环境下,数据采集的快、准、稳。比如,智维动环作为“边”侧软硬件一体化应用,融合了边缘计算、大数据计算、低代码组态技术,为腾讯数据中心基础设施系统提供了一个高可靠、一体化的属地管控平台,实现了对电力、暖通、环境、安防的一体化安全管控以及能耗能效的全面统计分析。“云”“边”“端”产品的无缝协同实现了运维效率最大化,为业务提供了一致性、高质量的服务保障。
三 成果:高质、高效、低成本
目前,运用“超大规模数据中心集群-智能化运营管理技术”,腾讯已经管理了遍布全球的过百万台服务器,并在持续不断的实践优化中,取得了极佳的运营成效。
在运营成本方面,自动化平台建设与运维的成本相比传统模式,节省80%以上,人力成本节省50%以上。在运营效率上,腾讯数据中心单人工作效率大幅提高,机架利用率显著高于行业平均水平。在绿色节能领域,AI节能、AI设备健康度预测等智能化技术的应用带来了Opex的持续降低。
我们可以看到,超大规模数据中心集群-智能化运营管理技术”的运用,帮助腾讯实现了海量数据中心集群的绿色、高效、高可靠和低成本运营管理,不仅如此,该技术的效果还将在长期的实践中持续优化。
颁奖典礼现场
四 未来:更快、更远、更稳
数据中心科技成果奖对于腾讯是一个新的激励,也是一个新的征程。我们相信,超大规模集群智能化运维管理技术的应用能够有效应对超大规模集群的挑战,为数据中心行业的发展、甚至国家数字经济的建设发挥积极重要的作用。
同时,在本次数据中心行业峰会上,腾讯数据中心智维平台负责人岳上荣获2022年数据中心青年科技人才奖。我们相信,在全体数据中心工作者的努力下,在持续不断的技术钻研中,腾讯数据中心将不断前行,助力数据中心自动化运维道路走的更快、更远、更稳。
腾讯数据中心获奖证书