磨砺,文火,慢熬,起锅前再加一点“匠料”

2020-02-12 19:10:20 浏览数 (1)

引言

数据中心运营是一项复杂的系统性工作,涉及各类专业多达十余种。漫长的运营周期,赋予了一线运营人员专业专注、精益求精的工匠特质。每一次巡检、每一次维护、每一次变更的背后,都离不开对方案细节、操作步骤、运营影响的全方位考量,而工匠精神正是在这些微小的细节中孕育和萌发。日复一日纷繁复杂的运营维护,不仅磨砺了一线运营人员精深的功底,更是激励和引导着他们立足一线、不断优化创新。

在多年的经验积累和技术沉淀过程中,腾讯数据中心运营人员正在不断推动一线运营的革新。从数据中心架构设计创新,到设施设备、辅助工具优化改良,目前已经累计申请数据中心相关专利60余件,获得专利授权近40件。“以匠心持续深耕专业技术,以创新不断打磨运营能力”,正在成为腾讯数据中心对“工匠型创新”精神的探索与追求。

本文将选取近三年来腾讯数据中心已经落地专利中的4项作为分享主题,希望以此为契机抛砖引玉,引起行业对一线运营优化创新的关注和重视;期待行业内出现更多的“匠士”,共同推动数据中心运营能力迈上新的台阶。

一种服务器辅助上架装置

随着服务器性能、硬件配置的不断提升,其重量也越来越大。以往普通服务器重量约20~30kg/台,而新型的高性能服务器已经提升至40~70kg/台。重量的成倍增加,给设备上架以及后期运维带来了极大的挑战;如果继续采用单纯的人工上架方式,不仅将占用更多的人力,而且存在设备跌落伤人的风险。随着腾讯数据中心运营的服务器超过百万大关,服务器上下架这一看似不起眼的工作场景,却已经成为了一线运营人员无法忽视的问题。

在此背景下,我们设计了一款服务器辅助上架装置,运营人员可将单台重量达50kg的服务器放置在承重台上,通过控制屏设定升降高度,由电机驱动传动机构,实现对服务器的升降,精度可达毫米级。当服务器到达指定高度后,由运营人员轻轻推送服务器进入机位即可。此外,该上架装置还设计包含:刹车限位、升降自锁与减速保护、人员辅助踏步、断电自锁保护等实用功能。该辅助上架装置已经申请发明专利,完成打样制造,并应用到机房运营中,在提升运营人员工作效率的同时,也进一步保障了人员和设备运营安全。

目前行业内从事服务器升降设备生产的公司稀少,其中ServerLift作为知名度较高的品牌,主要在海外售卖,而且价格较高。由腾讯数据中心研制、厂商共同生产的服务器辅助上架装置,其成本约为ServerLift同等产品的30%(随着设备量产,价格优势将更加突出)。此外,随着单台IT设备重量的进一步增加,我们已经开始着手研制液压式上架装置,有望达到200kg的承重目标,并能够适应不同机房环境的使用要求。

一种易维护式电池柜

电池柜、电池架作为存放蓄电池的结构体,通常并不为人所关注。往往真正出现蓄电池相关的问题时,才发现这些问题的背后与电池柜的设计有着千丝万缕的关系。基于过往的运营实践和故障案例,我们发现蓄电池更换困难蓄电池漏液风险这两个问题值得深入研究和探讨。于是,一款可以解决上述两个问题的易维护式电池柜应运而生。

蓄电池更换困难

通常单节蓄电池重量可达70kg,应用于模块化数据中心的电池柜通常配置5~6层,每层可放置4节电池。当蓄电池出现故障或到达使用寿命时,蓄电池的更换将极为困难,其中还隐藏着巨大的人身安全风险。通过设计抽拉式电池托盘,可从电池柜前后两侧抽拉;单方向层板具备200kg承重能力,带限位和锁定保护,可以完全承载2节蓄电池。同时,通过配合液压支撑小车,可以实现水平、竖直方向上的移动。

蓄电池漏液风险

蓄电池在长期运行过程中,一旦出现漏液,将极易腐蚀金属支架,严重时可能造成接地短路故障。为了解决漏液带来的风险,我们在接液盘中设计了支撑斜面,让漏液可以快速汇集到漏液孔。同时,设计引流管,将各层漏液孔通过软管统一汇集至底端接液盒中,实现对漏液的安全、快速排出。日常巡检时,也可将底端的接液盒抽取出来进行检查。

一种便于巡检的智能PDU

PDU作为末端电源的集中分配装置,直接向服务器、交换机等设备提供电力,是数据中心应用数量最多的设备之一。在长期运行过程中,PDU内部的接线端子可能出现松脱、老化等现象,导致线缆发热、损毁,进而引起PDU故障、机架掉电等。通过调研发现,现有的PDU设计通常难以发现上述运营隐患。

为了规避上述隐患,我们设计了一款带有可开关式透明盖的PDU,并配置温度检测模块。日常运营过程中,运营人员可在巡检时目视检查接线端子外观,也可以打开透明盖,使用点温枪/红外热成像仪进行温度扫描;而温度检测模块更进一步实现了对PDU运行的在线监测。

一种新型储油罐结构设计

柴油发电机组作为数据中心后备供电系统,在市电中断或异常时,需要能够快速投入并持续稳定工作,这背后也离不开供油系统的高可靠性。但在柴油发电机组实际运行过程中,我们发现由于柴油品质不一、柴油自身氧化、沉淀等因素带来的影响,将在储油罐底部形成杂质沉淀,导致油罐从顶部到底部的柴油品质逐渐下降。而储油罐在补充或抽取柴油过程中,由于油泵压力较大,容易将储油罐底部杂质和积水冲起,致使油罐顶部柴油品质下降。一旦杂质较多的柴油进入柴油发电机组,将导致柴油发电机组输出电压不稳定,严重时甚至可能导致柴油发电机组无法正常运行。此外,储油罐属于密闭空间,检修较为困难,底部杂质和积水难以有效排出。

因此,我们设计伞状的减压分流结构,用于减小柴油补充过程中对油罐底部沉积杂质的冲击;同时将出油口位置设计为弧形面,优先抽取上层柴油;并通过配置过滤阀,进一步过滤杂质。此外,为便于定期检查油品质量,设计独立的清油管道,确保有效排出储油罐底部杂质和积水。

结语

“天下大事,必作于细”。

就令萤火一般,也可以在黑暗里发一点光,不必等候炬火。此后如竟没有炬火,我们便是唯一的光。以上真的是鲁迅说的。

随着腾讯数据中心规模、体量的不断增加,坚守在一线的运营匠士正在经历着越来越多的新场景、新挑战。在未来,我们将继续秉持“工匠型创新”精神,通过不断细化运营思路;结合现场实际不断创新、改良已有产品技术,优化流程方法;用沉淀后的经验和技术,持续探索和实践,为数据中心的发展带去新的活力,也为数据中心运营创造更加广阔的想象空间。

0 人点赞