“阴阳相济,生生不息”——数据中心经典医案赏析

2018-03-16 16:07:42 浏览数 (1)

所谓日久情深,作为数据中心经理,我们常常将数据中心当作自己的孩子,为之挡风避雨,为之担惊受怕。即使只出现风吹草动,我们亦是辗转反侧,夜不能寐。或是久病成良医,多年的磨砺练就了我们一颗“大白”的心。一次“病痛”,一次胆战心惊,方才凝聚出数据中心医案典藏。今天,我们将为大家带来其中一则经典”医案”,请各位看官轻拍。

一、患者基本信息

姓名:XX数据中心

年龄:6岁

职业:互联网&IT

过敏记录:市电抖动或中断,市政施工作业,极端天气等自然灾害。

症状自诉:长期心慌、失眠、多梦、躁动不安;抵抗力弱,难以适应受外界环境变化。

为什么受伤的总是我?

二、初步检查

鉴于患者从事互联网IT行业工作,并长期持续产生上述症状。于是我们仰望星空,掐指一算,还是决定先做一个“X光扫描”一窥究竟。

检查项目:X光扫描

参照说明:

X光片分析:

通过X光片,我们不难看出,患者的病可谓事出有因——既有先天之亏,也有后天不足。

1. 先天之亏:该机房模块仅配备了2套UPS,除核心机架为双路UPS保障,其他机架均为单路UPS。

2. 后天不足:业务布局不合理#1,即使机房内的业务主备模块冗余,仍存在很多单点故障的风险。这是后期业务部署埋下的隐患,详情如下:

1) 近80%的DB类机架在一套UPS下供电

2) 100%的逻辑类机架在一套UPS下供电

3) 100%的接入类机架在一套UPS下供电

#1补充解释

业务布局不合理:IDC行业常见“疾病”,通常指业务侧不了解机房基础环境的架构冗余性,资源侧在分配资源时并不了解业务模块特性,机房运营人员不了解业务架构特性,导致业务上架分配不合理,而显著降低业务可靠性。再加上使用高密设备,很可能将主备模块分布在同一物理设备,同一机架、同一交换机、同一套UPS下,这将显著增加业务中断的风险和几率。

三、治疗方案

先天难改,打娘胎里带来的病根,动则伤筋动骨,事倍功半。于是,力补后天之虚就成了我们的治疗方向。腾讯IDC运营团队主动出击,联合业务、资源团队组建“专家团队“开展”联合会诊“,结合业务架构与特性,制定”疗程“(批次优化整改方案)。

治疗方针:

优化资源,合理分配,规避单点,应急演练。

(1)50%的DB类机架由一套UPS供电,50%的DB类机架由另一套UPS供电。

(2)50%的逻辑类机架由一套UPS供电,50%的逻辑类机架由另一套UPS供电。

(3)50%的接入类机架由一套UPS供电,50%的接入类机架由另一套UPS供电。

通过“复诊”可以发现,资源侧合理的分配策略,将业务的主备模块分布在不同的UPS下供电,从而规避单机架、单交换机、单路UPS供电的单点风险。同时,通过开展联合演习,将故障应急演练落到实处,便可成竹在胸,风雨无忧。

X光片复诊:

参照说明:

患者回访:

现在早睡早起,神清气爽。牙好胃口好,吃嘛嘛香。哦也!

四、医案总结

本例乍看尽是先天不足,好似无力回天。然而,常言“人无完人,金无足赤“——数据中心基础架构也是如此。由于数据中心的发展历程,产生了当前数据中心行业的一大特点“存量数据中心多为Tier2,新建数据中心多为Tier3,凤毛麟角Tier4”。对存量数据中心进行大规模改造显然是得不偿失,而过于追求基础架构的可靠性等级所产生的人力、物力耗费也是数据中心行业难以承受之重。

弥补后天之缺,却往往能峰回路转,事半功倍。这也就要求我们了解业务的架构与特性,并结合数据中心基础环境,进行合理的布局和资源分配。诸如通过规避业务主备模块分布在同一整机、同一机架、同一交换机、同一UPS等策略,显著提高业务可靠性,从而实现低投入高收益。 

但是,古语有云“上工治未病,不治已病,此之谓也”。对于新建数据中心,“治未病”就要求我们在数据中心规划、建设、验收阶段严格把关,将隐患扼杀在萌芽之中。当然,面对已经交付运营的数据中心,我们也不能“放弃治疗”;数据中心运营团队的“临床一线”经验,正是我们“治未病”不可或缺的依据。

国医讲究阴阳协调。行业普遍推崇的数据中心最佳模式——“Tier3的基础架构 五星级运营”,实则与之暗合。设计架构和硬件设施是先天之本,是我们坚实的基础,可谓之阳;运营体系则是后天之重,是我们深厚的软实力,可谓之阴。如若阴阳相济,必然生生不息。

0 人点赞