全面开启“运营新时代”
8月11日,第三届CDCC绿色能源大会在南京举行,腾讯携手CDCC正式开启“数据中心运营新时代”,这标志着数据中心运营将从“以快速交付为核心”逐步转向“以可持续发展为核心”。会上,腾讯数据中心分享了自身的自动化运营实践,探讨了运营新时代的特点和发展方向。未来,数据中心运营将围绕绿色低碳的目标,朝着平台化、集中化、自动化和智能化的方向稳步前行。
图1“运营新时代”启动仪式
数据中心运营进入新时代
开往自动化与智能化方向
腾讯数据中心经理熊操在会上介绍了腾讯使用软件机器人进行数据治理、并在此基础上使用AI进行PUE调优的实践案例,他指出,数据中心的自动化运营管理是大势所趋,为了提升运营效率和质量,数据中心要具备完善的运营规范、准确的设备数据、全面的监控管理以及持续优化的能力。
图2腾讯数据中心经理熊操
设施集中化运营
运营工程师向FRE转型升级
大规模的数据中心需要集中化的运营方案,这也对运营人员提出了新的挑战,需要他们快速发现、修复和处理运营隐患。运营新时代,基础运维人员将全面升级为基础设施可靠性工程师——FRE,FRE不仅是对运营人员的能力要求,也是运营新时代的特征。
腾讯数据中心服务台负责人王嵩指出,FRE要更加注重数据运营,通过对产品设计、数据分析与低代码能力的掌握,为运营工作减负提效。目前,腾讯数据中心运营团队已经开始向FRE转型,在监控事件、告警运营、辅助决策等平台的支持下,腾讯数据中心的运营管理工作取得了良好成效:告警准确率高达98%,重大运营风险主动监控率和事件处理效率高达99%以上,运营吹哨人能够在一分钟内完成重大事件响应和跟进。随着FRE的不断深入,腾讯数据中心的运维工作将更加安全、智能和高效。
图3腾讯数据中心服务台负责人王嵩
重视数据治理
可信数据构筑自动化运营基石
准确的数据是数据中心的运营基石,新时代,数据中心的运营更加强调对海量设备数据的治理。腾讯数据中心智维数据治理负责人林锐锋在会上分享了腾讯在自动化运营中对海量设备数据治理的经验和成效。他表示,面对海量数据,我们需要利用技术手段、而非工程化的思路来解决问题——基于数仓建立数据治理体系,可以实现超大规模的数据分析,从容应对海量数据分析及治理问题。
优秀的自动化运营能力离不开先进的技术与精确的数据,而数据的精确性则有赖于可靠的设备和配置。林锐锋指出,自动化和精细化运营需要厂商提供的设备更加准确、及时、稳定,在未来,腾讯希望能够和合作伙伴一起参与到可信数据的建设中,共同筑牢数据中心自动化运营的基础底座。
图4腾讯数据中心智维数据治理负责人林锐锋
物模型体系建设
推动软硬件的标准化
物模型体系是数据中心基础设施物理世界与自动化虚拟世界之间的连接纽带和数字投影,而物模型体系的建设离不开物模型标准的统一。腾讯数据中心智维数据挖掘和应用负责人庞孟羽分享了腾讯智维的物模型体系设计经验。他表示,应用物模型体系不仅能够减少接入工作量、实现规模效应,还能打通告警、变更等关键业务场景,拉通端、边、云的整体链条。
新时代的数据中心运营强调软硬件标准的统一化,而统一的物模型标准需要行业共同建立。庞孟羽指出,腾讯希望能够与物模型厂商合作,共同建立物模型标准,实现物模型的即插即用,最大限度优化部署成本和质量。
图5腾讯数据中心
智维数据挖掘和应用负责人庞孟羽
会上,腾讯正式发布了数据中心达尔文物模型开放联盟站点,希望携手合作伙伴,共同建设好数据中心的物模型体系,助力数据中心向自动化与智能化时代迈进。
https://darwin.tidc.tencent.com(请在pc端访问)
图6腾讯数据中心达尔文物模型开放联盟站点
基础设施深度定制
赋能数据中心精细化运营
运营新时代,深度定制化的基础设施更加符合规模化与集中化自动运营的需求,这需要底层基础设施产品具备更高的开放度、更深层的标准化逻辑和接口。腾讯数据中心首席架构师林志勇在会上通过介绍腾讯数据中心的演进过程和存在的问题,分析了关键基础设施深度定制化的必要性。
林志勇指出,深度定制化能够赋予基础设施更多能力,为数据中心的精细化运营提供强大可靠的保障。他还表示,深度定制化需要满足具体、开放、快速、复用和互补五大特性——即产品深度耦合使用场景、可对其进行全生命周期管理、能够快速定位和及时修正问题、可在不同项目中复用、能够充分整合合作方的优势等。
目前,腾讯数据中心已经在间接蒸发AHU上进行了深度定制化尝试,未来,我们还将在更多的数据中心基础设施产品上持续投入,通过更精细化的产品定制来满足新时代的自动化运营需求。
图7腾讯数据中心首席架构师林志勇
智能化手段助力
数据中心运营水平有效提升
在数字经济的驱动下,新时代的数据中心向着绿色、低碳和智能方向不断发展。腾讯数据中心运营总监郁智华和腾讯智维Tech Lead杨朴等人在圆桌论坛上,就“如何用智能化手段有效提升数据中心运营水平“展开了探讨。
杨朴表示,智能运营的核心是由人工决策转变为数字决策和 AI 决策,能针对复杂场景和突发事件快速定位告警风暴核心,自动做出全局最优决策。目前,AI 智能化技术在数据中心得到了广泛采纳和应用。比如腾讯智维平台基于图模一体化技术推进事前、事中、事后管理,融合物模型等技术、已经从系统角度实现了一定程度的自动化和智能化运维。
郁智华也指出,未来的数据中心将聚焦于主动式运营,强调线上运营的能力,借助智能技术架构和精细化运营的手段,持续有效提升数据中心运营的质量和效率。
图8圆桌论坛
数据中心未来:可持续 高质量
运营新时代,在碳中和政策的背景下、在海量集中自动运营的要求下,数据中心运营工作需要更开放更敏捷的创新。截至目前,腾讯在全球已拥有超过100个数据中心,运营体系和技术架构不断升级。在未来,腾讯数据中心希望携手行业伙伴,共同探索数据中心的自动化和智能化运营道路,推动数据中心运营的绿色可持续和高质量发展。