你好,这里是网络技术联盟站。
当今,数据已经成为企业越来越宝贵的资产,而数据中心的可靠性和可用性也因此成为企业关注的焦点。数据中心不仅为组织提供了数据的储存、处理和传输,还承载了关键业务和关键信息的重要任务。然而,如何确保数据中心能够持续运行并保护数据的安全性成为了一项极具挑战性的任务。
在这个充满竞争的数字时代,数据中心的故障或中断可能导致灾难性的后果,不仅损害了企业的声誉,还可能造成巨大的经济损失。因此,数据中心的可用性和可靠性变得至关重要。在这一背景下,Tier 可靠性标准应运而生,成为了数据中心行业中最知名、最广泛使用的标准之一。
在本文中,我们将深入探讨 Tier 标准的意义以及它如何为寻求高可靠性数据保护和可用性的客户提供了卓越的优势。我们将解析 Tier 标准的核心概念,探讨各个级别的含义,以及为什么越来越多的企业将其视为数据中心运营和保护数据的黄金标准。让我们一同踏上这个探索之旅,深入了解如何通过 Tier 可靠性标准来保护和提高数据中心的性能和可用性。
目录:
TOC
一、专业术语
在文章开始,先解释几个术语,方便阅读本文。
- 层(Tier): 数据中心的性能级别,根据其基础设施的设计和运营特征划分。通常,Tier越高,数据中心的可用性和性能水平越高。
- 正常运行时间(Uptime): 数据中心系统的可用性,也就是数据中心运行和可供使用的时间。通常以百分比来表示,高可用性数据中心可以提供更多的运行时间。
- 数据中心(Data Center): 用于容纳关键IT系统和设备的设施,包括服务器、存储和网络设备。数据中心通常是企业存储和处理数据的关键地点。
- 基本容量(Basic Capacity): Tier分类系统中的最低性能水平,包括电源和冷却系统的最低设计和操作要求。这是数据中心基础设施的最低标准。
- 冗余容量(Redundant Capacity): 指数据中心基础设施内关键组件的复制,以确保在组件发生故障或中断时继续运行。冗余性是提高可用性的关键因素之一。
- 同时可维护性(Concurrently Maintainable): 数据中心能够在不影响整体运行的情况下维护和升级系统组件和设备。这意味着可以在维护过程中继续提供服务。
- 容错(Fault Tolerance): 即使一个或多个组件发生故障,系统仍能够继续运行的能力。容错性是确保数据中心不中断运行的重要特性。
- 基础设施(Infrastructure): 数据中心的物理组件,包括电源、冷却、服务器、存储和网络设备。这些组件共同支持数据中心的运行。
- 运营(Operations): 数据中心的日常管理和维护,包括基础设施的监控、维护和升级。有效的运营确保数据中心保持高性能和可用性。
二、数据中心认证机构
在全球范围内,有几个知名的数据中心认证机构,它们的认证标准受到广泛认可。
2.1 TÜV TSI认证
TÜV TSI认证是由德国的TÜV SÜD认证机构提供的,它评估了数据中心的可用性、安全性和可持续性。这个认证标准在全球范围内都受到广泛认可,对于企业来说,选择获得TÜV TSI认证的数据中心可以增加信任度。
2.2 CQC认证
CQC(中国质量认证中心)认证是中国国内的一种认证标准,它关注数据中心的质量和性能。在中国国内的数据中心行业,CQC认证也具有一定的影响力,有助于确保数据中心符合国内的质量和安全标准。
2.3 Uptime Tier认证
Uptime Tier认证是由Uptime Institute提供的全球性认证标准,它主要关注数据中心的可用性和冗余性。Uptime Tier认证分为设计认证、建造认证、运营认证和M&O认证等不同阶段,可以帮助企业了解数据中心的性能水平以及其可用性等级。
三、什么是数据中心层级?
数据中心层级是一种标准化的排名系统,用于表示数据中心基础设施的可靠性。该分类将数据中心设施从1到4进行排名,其中1表示最低级别,4表示最高级别。
这些等级由Uptime Institute提供,Uptime Institute是一个独立的组织,主要根据以下因素确定设施的层级:
- 保证正常运行时间
- 容错能力(处理计划内和计划外的中断)
- 服务成本
这种公正的分级系统可以客观地了解特定数据中心的运营方式。但是,这些等级是可选的,因此并非所有数据中心都有分配的等级。然而,大多数主要设施都会选择请求Uptime Institute进行评估,因为官方评级有助于:
- 建立服务信誉
- 推销设施能力
- 建立信任并吸引潜在客户
- 规划未来的升级和设施扩建
要获得官方评级,数据中心工作人员需要将场地平面图和蓝图(设计文件Tier Certification)发送给Uptime Institute。随后,Uptime Institute的代表将前往该中心现场检查运营情况并进行评级。
Uptime Institute成立于20世纪90年代末,是一家专门评估数据中心可靠性和可用性的独立组织。该公司的主要成就之一是创建了Tier标准,该标准已在业界广泛使用和认可。引入层级的目的是帮助组织理解和定义数据中心基础设施和架构要求。最初,他们只定义了三个级别的Tier标准:Tier I、Tier II和Tier III。Tier I级别对应最低的可靠性和可用性,而Tier III级别提供更高程度的可靠性和可用性。2008年,增加了第四个级别——Tier IV。它专为需要最大可靠性和容错能力的数据中心而设计。Tier标准在业界的重要性迅速增强。许多组织已开始努力根据该标准对其数据中心进行认证。获得Uptime Institute颁发的Tier证书证明该数据中心满足可靠性和可用性的高标准。该公司开始使用Tier标准作为其数据中心设计、建设和管理的基础,以确保其系统和数据保护的最佳运行条件。
四、一级数据中心
一级数据中心,作为最基本的级别,通常不提供任何关键系统的冗余保证。
根据Uptime Institute的要求,一级数据中心至少需要提供以下基础设施:
- UPS(不间断电源):以确保在电力中断时提供电力供应的设备。
- IT系统的指定空间:用于托放计算设备和服务器。
- 专用冷却设备:通常只在办公时间以外运行,用于维持适宜的温度和湿度。
- 发动机发电机:用于备用电源,以在电力故障时提供电力。
然而,一级数据中心的一个显著特点是,它们仅提供单一的电力和冷却分配路径,没有冗余系统来保护免受计划内或计划外中断的影响,包括日常维护。这种冗余的缺乏使得一级数据中心容易受到各种类型的中断影响。
在一级数据中心,通常可以期望每年至少99.671%的正常运行时间,这相当于每年最多28.8小时的停机时间。尽管一级数据中心在可用性方面不如更高级别的数据中心,但它们因其简单性而成为了一些小型企业和初创企业的经济实惠之选。对于那些可以容忍在非工作时间进行定期维护并且没有复杂的运营要求的客户来说,一级数据中心可能是一个可行的选择。
五、二级数据中心
二级数据中心,通常被称为Tier II数据中心,是建立在第一级数据中心标准的基础之上,具备一些重要的改进和冗余组件。这些改进措施旨在提高数据中心的可靠性和可用性水平。
每年可靠性达到惊人的99.741%,这意味着几乎每年都可以保证数据中心以高效方式运行,仅会有22小时的停机时间。
尽管Tier II数据中心在可靠性方面取得了显著的进步,但仍然使用单一的供电和冷却分配路径。这一设计特点暗示着在某些情况下,例如供电或冷却系统出现故障,仍然存在潜在的中断风险。因此,在Tier II数据中心的规划和管理中,必须特别关注风险管理和灾备计划,以有效地应对可能发生的意外中断。
Tier II数据中心对于中小型企业(SMB)而言,是一种备受欢迎的选择。这是因为它提供了可靠性保障,同时也能够控制成本,满足了中小型企业对运营完整性的需求。Tier II数据中心为这些企业提供了均衡的解决方案,将可靠性与成本效益相结合,因此成为了SMB企业的首选之一。
六、三级数据中心
三级数据中心是一种高度可靠的IT基础设施,它通过采用N 1的冗余配置以及多个电源和冷却分配路径,提供了比Tier II 数据中心更高的可用性和可靠性。N 1 冗余意味着Tier III 数据中心不仅具备支持全部IT负载的能力(N),还提供了额外的备用组件( 1),以应对单个组件的故障,从而确保性能不会受到影响。
此外,Tier III 数据中心还利用多个分发路径,以确保在一条路径不可用的情况下不会导致服务中断。这种级别的冗余提供了并发可维护性,这意味着可以关闭每个关键组件或分发路径以进行计划性维护,而不会对IT环境造成影响。
相对于Tier II 数据中心,Tier III 数据中心显著提高了可用性。它的正常运行时间达到了99.982%,每年停机时间不超过1.6小时,这意味着几乎每年都可以确保数据中心持续运行,停机时间非常有限。
尽管Tier III 数据中心具备强大的可靠性和冗余,但它并不是完全容错的。它允许进行日常维护而不会影响服务,但在意外事件发生时,仍然面临潜在的停机风险。此外,由于已经部署了备份组件,因此在维护窗口期间发生中断的风险也会增加。
Tier III 数据中心通常吸引大型和不断增长的企业,这些企业需要更高的可靠性和效率,超越Tier IV 数据中心提供的更复杂的保护。这一级别的可用性使得Tier III 数据中心成为大型企业的首选,为它们提供了高度可靠的IT基础设施,以支持其日常业务需求。
七、四级数据中心
Tier IV 数据中心代表了Uptime Institute认证的最高级别,是数据中心可用性和容错性的巅峰体现。其容错设计达到了极致,为关键业务提供了前所未有的可靠性和容灾能力。
在Tier IV 数据中心中,容错设计的关键特点包括:
- 完全独立的架构:Tier IV 数据中心采用完全独立的备份架构,这意味着它能够完全复制主要架构的每个关键组件。无论是电源、冷却还是网络设备,每一个都有备份,这确保了即使在最严重的情况下,如主要架构的彻底故障,数据中心仍然可以继续运行。
- 多个分发路径:为了提供冗余性,Tier IV 数据中心采用了多个电源和冷却分发路径。这意味着无论一条路径是否可用,数据中心都能保持运行。这种多样性的设计进一步提高了可用性,降低了中断的风险。
- 2N 或 N N 模型:Tier IV 数据中心采用2N或N N的容量模型。这意味着数据中心具备两倍于满IT负载所需的容量。即使在计划内和计划外的事件中,如系统维护、意外停机或设备故障,数据中心仍能够稳定运行。冗余系统会在中断期间接管,确保持续运行,这使得用户几乎不会察觉到问题的存在。
- 2N 1 模型:为了获得额外的保护,Tier IV 数据中心还可以采用2N 1模型。这进一步提高了冗余性,提供了两倍的操作容量(2N)以及额外的备份组件( 1)。即使在使用辅助系统时发生额外的故障,数据中心仍然能够保持高可用性。