养兵千日,用兵一时——如何打造高可用柴发系统

2021-08-23 11:10:32 浏览数 (1)

养兵千日

用兵一时

柴发系统是数据中心在外市电异常时为设备提供应急电力供应的重要保障,其可靠性对于保证数据中心在极端情况下的业务稳定性和持续性有着重要意义。

由于完整的柴发系统由柴发机组、并机系统、供油系统、进排风系统、配电系统、接地系统和测试负载等组成,其可靠性会受到多方面因素的影响,除机组性能质量以外,其中尤以配电、并机、供油、进排风等四个子系统对整体可靠性影响较大。下文从架构设计、功能配置、维护保养等角度,对这四个子系统的可靠性影响因素进行了分析,并给出了一些相关的优化建议。

腾讯某数据中心集装箱柴发集群照片

配电系统架构影响简析

配电系统的架构是决定系统可靠性的基石,但可靠性在一定程度上与经济性呈现反比关系,数据中心作为一个综合性基础设施工程,需要根据其规模、业务类型和工程预算等因素综合考量,选择最合适的系统架构。本章节中,将以国内数据中心中常见的中压柴发配电系统架构为例,分析各种构架中存在的可靠性影响因素。

01

一路市电 一路柴发

该架构设计多用于对冗余性要求不高的小型机房,单点隐患较多,可靠性较低。当应急母线的出线柜、应急母线与市电母线的联络线、市电母线的应急电源进线柜出现故障时,均有可能引起柴发系统的单点故障。另外,在国内部分地区,供电局对企业自备应急电源系统的投切要求较为严苛,如可能会要求手动切换等,进一步降低了系统的可靠性。

02

两路市电 一路柴发

该架构设计广泛应用于国内大型数据中心,具备一定的冗余性和容错性,供电可靠性较高,该架构的单点存在于应急母线处。在设计、运行过程中应关注项目所在地供电局对企业自备中压配电系统备自投以及应急电源系统的投切要求,合理制定控制系统和并联系统的逻辑策略,以提高系统运行的可靠性和灵活性。

03

两路市电 一路柴发分段

此种构架相较于第二种架构,每台柴发因配置了2套输出配电柜以对应两段独立的应急母线,可满足应急电源冗余和容错能力的要求。其中发电机输出配电柜、应急电源母线出线柜的故障仅对系统的冗余性产生影响,应当给予关注。由于控制系统点位增多,应关注控制逻辑的合理性和有效性。同时需关注控制程序的复杂程度和所占用的控制装置存储空间,避免因为综保等控制装置硬件处理能力不足而导致的程序执行效率低下、卡死等情况。

3种架构设计对比

性能/架构

一路市电 一路柴发

两路市电 一路柴发

两路市电 一路柴发分段

冗余性

一般

容错性

一般

可靠性

一般

经济性

一般

并机系统影响简析

并机系统是整个柴油发电机组集群的控制中枢,负责各机组的状态、参数的监测、调整和控制,同时为机组提供必要的保护功能。并机系统的可靠性直接决定了柴发系统是否能够可靠、稳定、高效地提供电能。

01

并机控制器的通讯拓扑

目前柴发并机系统多为分散控制系统(DCS),系统稳定性在很大程度上由其控制器的通讯拓扑决定。常见的拓扑有如下三种:

(1)

星型拓扑

以中央节点为中心,并用单独的线路使中央节点与其他节点相连接,相邻节点间的通信必须通过中心节点,所以中央节点故障会导致整个系统失效,单点隐患较为严重。另外,若其他节点与中央节点之间的线路中断,也会导致该节点离线,失去功能(详见下图)。

(2)

环型拓扑

各个控制器通过通讯线缆连接起来,最后形成一个闭环。可实现各节点的自举控制,任意节点故障或者连线中断都不会影响系统的整体功能。不过要注意节点之间的通讯方向和控制策略,若节点间仅能单向通讯,则任一节点的离线都会导致系统的失效(详见下图)。

(3)

总线拓扑

总线拓扑使用一条主通讯线缆串接所有的节点,所有接入总线的节点都拥有平等的优先权,可实现各节点的自举控制。任一节点故障只会导致该节点离线,不会对系统的整体功能产生影响。但总线上的信号受到干扰或中断会导致系统解体,甚至完全失效。(详见下图)。

02

并机控制的方式

目前常用的柴发并机系统的同步控制实现方式有以下两种:

(1)

通过机组自带控制器实现并机同步控制

此类系统中机组控制器不仅承担了发动机、发电机的监测、调节、控制、保护功能,还承担了机组并机的监测、控制、保护功能,包含各机组之间的同步(频率、相位、幅值调节)、以及机组与其对应的外部并机中压柜的分合闸控制及保护(详见下图)。

该方式下,机组自带控制器不仅实现了机组自身保护,其功能配置及参数设置更是避免单机故障对系统整体可靠性影响的关键要素。

(2)

通过外部并机控制器实现并机同步控制

即常见的并机分控柜,此类系统中机组控制器仅承担发动机、发电机的监测、调节、控制、保护功能,而机组并机的监测、控制、保护功能则由外部并机控制器负责,包含各机组之间的同步(频率、相位、幅值调节)、以及机组与其对应的外部并机中压柜的分合闸控制及保护(详见下图)。

该方式下机组状态控制与并机同步控制分别由机组控制器和外部并机控制器实现,而外部并机控制器的功能配置及参数设置则是避免单机故障对系统整体可靠性影响的关键点。

03

并机系统的保护装置

为确保柴发系统保护的全面、可靠及有效,并机系统通常与应急母线上的并机中压柜共同承担了保护功能,常见的保护功能如下:

与并机同步逻辑无关的保护

柴发机组并机控制器根据采集的电量信号(如电压、电流、功率、频率等)和非电量信号(如机油温度、机油压力、燃油压力、冷却液温度等)作为保护判据,比如单机故障时的保护;

并机中压柜根据综保采集的电量信号(如电压、电流、频率等)作为保护判据,比如一段、二段过流,差动保护等,以及非电量信号(如由柴发机组并机控制器提供的故障联动信号等),比如发电机输出短路故障时的保护。

与并机同步逻辑相关的保护

柴发机组并机控制器根据采集的电量信号(如电流方向、功率方向等)作为保护判据,比如柴发机组失去同步时的保护;

柴发机组并机控制器根据采集的非电量信号(如各台机组的通讯信号)作为保护判据,比如控制器通讯丢失后机组切除异常机组的保护;

并机中压柜根据综保采集的电量信号(如电流方向、功率方向等)和非电量信号(如由柴发机组提供的失压联动信号等)作为保护判据。

供油系统影响简析

在日常运营系统中,可能会造成供油系统中断的因素有如下几点:

供油管线故障

此类故障主要由供油管线中断(爆管)、供油泵失效(管线失压)等原因造成,其中外部施工产生的机械损伤是导致此类故障的主要因素。

阀门拒动

此类故障多由于电动调节阀、电磁阀的驱动执行机构,如电动机、电磁铁线圈等部件故障失效导致。

燃油品质

此类故障一般因储备燃油混入大量水分或杂质导致,比如工程阶段未进行油管、油箱等杂质吹扫,或长期未进行油箱排污,甚至油罐因检修口密封不良导致进水等。

燃油耗尽

大型数据中心均采用了日用油箱 储油罐的配置方式,若因布局限制无法设计平衡管,可能出现油罐内燃油量不均,甚至日用油箱补油速度不一致的情况,导致部分柴发因缺少燃油而停机。另外,还需要关注油罐区卸油口的可达性,部分机房可能由于设计、施工或杂物堆放等原因导致油罐车无法抵达卸油口附近完成储油罐燃油补充。

进排风系统影响简析

柴油发电机房的通风系统设计包含平时通风和工作通风,其中工作通风应考虑每一台机组对进、排风面积的要求,并充分计算降噪结构设计、以及气流通道对风阻的影响。若因机房建筑结构布局,采用了发电机房侧向进风方式设计,当多台机组启动运行时,系统中远离机房进风口的机组甚至可能会受气流组织影响,出现进气温度高或进气量不足而导致容量下降。

柴发系统可靠性的优化建议

由于单体设备故障的必然性,系统需要具备一定的冗余性和容错性,在其组成部分发生故障时,应能迅速隔离故障点,防止故障扩大。故在数据中心等高可靠性要求的应用中,除了关注各类设施、设备自身的可靠性,更要通过冗余、备份、防错等手段,从环境、设计、维护保养等多方面综合考量,提升柴发系统的整体可靠性。

01

机房环境

机房温度

柴发机房的工作温度建议在5℃~30℃之间,若偏离此温度范围较大,需要对启动蓄电池、启动蓄电池充电器、冷却水加热套等部件或系统设置进行适应性修改。

进排风

在进行柴发机房通风系统设计时,进风量应大于排风量,并考虑燃烧空气量的需求。若因机房布局原因使部分柴发机组远离进风口,或中间有其他柴发机组阻隔,应使用辅助手段提高有效进气面积或进风量,如增加进气口、辅助风机等。另外在设置主备关系逻辑时,建议将远离进风口的机组设置为后备机组。

空气过滤

若数据中心所在地的空气在特定时期内存在沙尘、柳絮、杨絮等杂物,可考虑在柴发机房进风口安装初级滤网,对空气中的大颗粒杂质进行初步过滤,但要保证安装滤网后的进风量仍能满足柴发的工作要求。

消防配置

若柴发机房内设置了消防喷淋系统,应合理选择喷淋头位置,避免向发电机、配电柜、封闭母线和电缆盒直接喷淋。同时应选择合适的喷淋头类型,避免柴发带载时的辐射高温导致误喷。对喷淋范围内的设备,合理选择防护等级,避免因消防喷淋系统误动作导致设备损坏。另外,也可在当地法律法规许可下,使用消防水喷雾系统或气灭系统,降低水喷淋诱发电气火灾的风险。

02

系统设计

系统中关键的冗余部件建议考虑物理隔离,如A/B路电源、关键冗余设备等,避免因故障扩大造成系统失效。

柴发系统并机控制器宜采用环型或总线结构,避免采用星形结构,其供电必须采用U电、直流屏或启动蓄电池等可靠性较高的电源。

柴发系统所用的并机控制器可考虑采用分布式控制。若采用主从控制,需确保检测到主机失效后,从机可以在短时间内接过主控权限,完成除故障机组外的机组并机。

建议将可靠供电作为保护设置原则,在单台柴发机组出现故障或同步异常时,在自身保护停机的同时,通过分闸命令分断其对应的并机中压开关,使其完全脱离系统,避免因为机组失控进入电动机模式使系统负载增加,造成系统输出波动甚至解列。

 供油系统设计时考虑一定的冗余,并关注隐蔽工程中易损设备、元器件的维护可达性,如供油泵、供油阀门等。若供油管线较长,需考虑室外敷设时的地面沉降对管道连接的影响,必要时可在建设时采用环型管路设计或敷设一套备用管路。设备选型时重点关注管径、油泵流量和供油路径长度,确保最远端柴发满功率运行时的燃油供给。供油管线上的阀门应有手动操作装置,在紧急情况下可手动操作阀门。

应根据数据中心所在地的年均最低气温选择合适的柴油标号,可参照下表:

柴油标号

适用环境

5号轻柴油

风险率为10%的最低气温在8℃以上

0号轻柴油

风险率为10%的最低气温在4℃以上

-10号轻柴油

风险率为10%的最低气温在-5℃以上

-20号轻柴油

风险率为10%的最低气温在-14℃以上

-35号轻柴油

风险率为10%的最低气温在-29℃以上

-50号轻柴油

风险率为10%的最低气温在-44℃以上

对于冬季气温较低的区域,埋地燃油管线应敷设在冻土层以下,裸露在空气中的管道需做保温,针对长距离的户外管道还应配置电伴热。

03

维护保养

按照制造商维保说明的要求,对柴发机组实施有效的保养。另外,机组在长期连续运行后(通常为120h以上,以制造商维保手册为准)也应该对机组实施保养,如及时补充消耗的机油量。

定期进行柴油发动机润滑油杂质分析,主要关注润滑油中的金属含量,并建立记录台账分析其变化趋势。

定期测试柴油发电机组启动蓄电池的健康状况,建议关注蓄电池开路电压、蓄电池启动电压降、蓄电池CCA值(即冷启动电流,一般不小于标准值80%)。

重点关注柴发机组控制系统的维护保养,如元器件温升、后备电源状态、信号连接牢固性等。

定期对柴油成分进行检测分析,尤其在雨季需关注柴油中的含水量。并定期对供油系统中的过滤器进行拆解清洗,去除脏堵的杂质。

柴油储备应能满足GB 50174-2017中的后备时间要求,并与燃油供应商签订应急供油协议,确保燃油的快速供应。

当柴发机组连续带载运行时间≥6h时,应当关注柴发的温度和温升是否在允许的范围内。

结语

作为应急电源的柴发系统,虽然年平均带载运行时间很短,但在紧急供电需求下,任何一个子系统的小概率故障均有可能导致严重的供电事故。因此作为数据中心管理者,不仅需要在设计阶段尽量规避相关风险,更要对已有系统中的风险薄弱点进行识别和管控,才能有效提高柴发系统的整体可靠性。

0 人点赞