重磅
发布
近日,腾讯数据中心服务台在总部深圳全新升级投产,该平台是目前国内最大规模的数据中心集中化运营服务平台,支撑腾讯全球100 数据中心及百万级IT设备的运营服务工作;标志着腾讯数据中心正在加速向集中化、平台化、智能化运营方向升级和发展。
腾讯数据中心服务台综合服务大厅
当前,腾讯云在全球数十个国家和地区建立起100 中大型数据中心,支撑百万级IT设备的运营管理。数据中心体量大、分布广、运营管理方式多样化等特点,给打造腾讯云数据中心全球统一标准服务带来了巨大的挑战。
早在2018年,腾讯数据中心服务台(ISC)应运而生。从数据中心基础设施集中化监控开始,不断拓展运营和服务方向;建立了IDC集中化运营、IT综合服务支持及腾讯IDC云服务门户三个板块;作为腾讯数据中心运营的中台,依托腾讯智维(Tnebula)掌握实时的运营动态,实现对全球各大数据中心的集中化运营和服务支持。
在处理海量IDC运营数据的同时,基于最佳实践不断对平台进行优化和持续改进。随着平台版本的迭代,平台可用性、可靠性的不断提升,腾讯数据中心运营管理,实现了从量变到质变的升华——由传统的属地化管理向平台化、集中化、智能化发展。
基于主动监控的
数据中心集中化运营
通过三年的发展,腾讯数据中心服务台(ISC)基本实现了对国内各数据中心的设施监控接入。从初期的以接入动环数据为主(智维1.0),到目前接入自研的本地智维数据为主(大园区智维2.0),一步步解决了DCIM平台的监控有效性和平台可靠性问题,推动智维平台的实用化,为后续的自动化及智能化运营打下坚实基础。
01
可靠的设施集中监控
告警质量决定了监控的实用性,经过长期运营、改进及提升,将经验和标准固化在智维2.0平台,平台实用化方面有了质的提升。
2021年服务台日均处理告警超过1万条,经过告警收敛后,通过事件单形式派发给各地数据中心进行检查、校验处理、反馈和总结,形成闭环持续迭代改进。
02
实时风险管控,打造运营的最后一道防线
设施系统的割接、操作及变更历来是数据中心运营高风险时段,通过对变更告警的隔离式监控、操作过程关键点check、异常监控的及时发现和第一时间启动应急响应,担负起“吹哨人”的职责,有效的降低了设施变更的风险。
03
基础设施 IT集中运营联动
通过建立数据中心基础设施监控告警与IT设备监控告警关联逻辑关系,实现基础设施运营与IT设备运营的联动。从而实现对基础设施变更、事件带来的业务影响的快速、准确分析和评估,进而提升业务应急响应保障的及时性。
7*24主动监控运营
此外,针对地震、台风等自然灾害,新冠疫情等公共卫生事件,重大节日业务保障等,腾讯数据中心服务台发挥平台化运营的优势,联动腾讯全网各地数据中心,启动相关流程和预案,为海量业务运营保驾护航。
统筹IDC服务站运营
7*24全方位服务支持
腾讯数据中心各园区现场部署着数千人的设施、IT运维团队,服务台统一负责对所有运维团队的技术能力进行培训、对管理策略变化进行传达宣贯,保障现场运维人员对设备的抢修、维护、维保能力。
服务器运维技术支持
同时服务台作为腾讯数据中心运维支持和调度中心,为腾讯全球一线服务站工程师、驻场工程师和业务运维同事提供故障处理、工单监控跟踪、技术支持等7*24综合运营服务。
客户服务统一入口
7*24全栈售后支持
随着数据中心和服务器自研产品的逐步成熟,腾讯智维、miniTB、TMDC、T-Block以及星星海系列服务器等产品均实现对客户的交付,腾讯数据中心服务台作为面向客户服务的统一窗口,提供咨询、报修、技术支持、需求响应等服务支持的工作。
为满足客户的服务请求,腾讯数据中心官网提供统一服务入口——而服务台正是该服务入口的支撑团队,通过集中调度全球数百个运维服务站的资源,从而实现快速响应满足客户需求。
腾讯数据中心官网https://tidc.tencent.com
随着我国数字经济的飞速发展,腾讯近年在华南、华东、华北、西南布局了超大规模数据中心集群,部署腾讯第四代数据中心Tblock。在新的格局下,构建了三级运营架构体系——总部级ISC 城市级ECC 楼宇级LMC,并将致力于探索基于超大规模数据中心集群的设备生命周期管理、能效管理、产品质量管理、数据中心架构优化等课题。
腾讯数据中心集群布局
20余年来,腾讯数据中心始终致力于先进的数据中心技术、运营管理的探索与追求。腾讯数据中心服务台,凝聚了腾讯IDCer二十余年的厚积薄发。随着腾讯数据中心服务台的全新升级,我们将开启下一个海量数据中心运营管理的新征程。