【云计算奇妙学习之旅】第六期:各级别RAID详解

2020-05-08 10:19:08 浏览数 (1)

在上一期的分享中,我们了解到企业级的存储是什么样子的,它由什么组成的。那么,本期分享我们该如何来使用存储,拿到一台新的存储设备,首先要什么呢?首先要做的是给存储上电开机然后做RAID,才能使用存储提供的空间。这个时候就要知道RAID是什么,我们该给存储选择配置什么样的RAID呢?

RAID的来历

随着科技的进步,现在来说,cpu和内存,已经不再是计算机的性能瓶颈了,IO才是计算机的瓶颈,特别是磁盘。即使存储上接了很多硬盘对性能是没有多少帮助的,所以有人就说,能不能把多个硬盘合在一起来提升性能呢?这就是RAID解决的第一个问题:性能。那如果这个磁盘坏掉了,数据不就丢了吗?这就是RAID解决的第二个问题:冗余。就是说当其中一个硬盘坏掉了,依然能够保证数据的完整性。如果把这两个问题解决了,那RAID我们就可以拿来用了。RAID全称Redundant Arrays of Independent Drives,有“廉价冗余磁盘阵列”之意。然后,研究这些的科学家根据不同的业务种类,又把磁盘阵列有分为很多种类,接下来为大家一一分析。

RAID-0

第一种:RAID-0,也称“条带化”。它必须由≥1块磁盘组成。

它的架构是什么样的呢?

假如说写一个word文档,这个文件100M,他会把这个100M文件进行切割,比如说按64K(一个切片大小,可以根据需要来设定)切割,然后分别写在不同的磁盘上。这样,就可以把100M数据同时写在多个硬盘上,而且多个硬盘能同时进行读写,是不是就提高了性能。而且是磁盘数越多,性能就越好,这就是RAID-0的特点。但是这种RAID-0没有冗余,也就是说任何一个磁盘故障,那么这个RAID组的整个数据就损坏了。所以,RAID-0的优点特别明显,缺点也特别明显。

RAID-1

第二种:RAID-1,也称“镜像RAID”,它必须是≥2的倍数块磁盘组成。

它的架构是什么样的呢?

RAID-1是将一个两块硬盘所构成RAID磁盘阵列,其容量仅等于一块硬盘的容量,因为另一块只是当作数据“镜像”。在写数据的时候,同时写两份,在成对的独立磁盘上产生互为备份的数据。它的优点是,冗余性高,缺点就是没有提高性能,不仅没有提高性能,还影响写性能。因为,RAID-0一个数据写1次,现在RAID-1要写2次;对读性能没有影响。这种方法可以解决硬件故障,但是不能解决软件的故障,就是说当一个硬盘故障了,镜像盘中的数据还可以使用进行数据恢复,但是当通过软件删除一个文件的时候,镜像盘的数据也会删除,这样才能保证数据一致了。

RAID-5

第三种:RAID-5,也称“分布式奇偶校验”,它必须是≥3的倍数块磁盘组成。

在实际的生产环境中,随后相继又推出RAID-2、RAID-3、RAID-4,但是现在只有RAID-3还在用,由于它们各自有不同的缺陷,渐渐就被放弃了,所以又出现了RAID-5,其实RAID-3和RAID-5很像。

它的架构是什么样的呢?

RAID- 5是一种存储性能、数据安全和存储成本兼顾的存储解决方案。RAID-5可以理解为是RAID-0和RAID-1的折中方案。RAID-5可以为系统提供数据安全保障,但保障程度要比Mirror低而磁盘空间利用率要比Mirror高。RAID- 5具有和RAID-0相近似的数据读取速度,只是多了一个奇偶校验信息,写入数据的速度比对单个磁盘进行写入操作稍慢。同时由于多个数据对应一个奇偶校验信息,RAID-5的磁盘空间利用率要比 RAID-1高,存储成本相对较低,是运用较多的一种解决方案。

RAID-5写数据,b1 b2 b3 P1的方式存储,这个P值就是校验数据 ,也就是说当b2故障了,可以通过b1b3加P1校验算出b2。

学过计算机的原理应该都知道,所有存放在磁盘上的不是数据不是文件,而是0和1,

通过与或运算(相同为真,相异为假),就是说0X0=0、1X0=1、1X1=0 。通过这样的算法,当一块盘故障后换上新盘,就可以计算出对应的数据了,进行数据恢复。

RAID-5校验数据是随机分布在各个盘上的,所以每一个盘都不会成为性能瓶颈。而RAID-3是有一个专门的盘只做校验盘,这个盘会成为性能瓶颈,因为所有的数据都只由一个校验盘参与,就导致校验盘压力特别大。而RAID-5是随机分布的,压力也是分散的。所以,RAID-5和RAID-0相比,有容错功能,最多可以坏一个盘,在企业中也是运用比较多的一种RAID。

RAID-6

第四种:RAID-6,它必须是≥4的倍数块磁盘组成。

RAID-6是由一些大型企业提出来的私有RAID级别标准,它的全称叫“independent data disks with two independent distributed parity schemes(带有两个独立分布式校验方案的独立数据磁盘)”。

它的架构是什么样的呢?

这种RAID级别是在RAID-5的基础上发展而成,因此它的工作模式与raid 5有异曲同工之妙,不同的是RAID-5将校验码写入到一个驱动器里面,而raid 6将校验码写入到两个驱动器里面,这样就增强了磁盘的容错能力,同时RAID-6阵列中允许出现故障的磁盘也就达到了两个,但相应的阵列磁盘数量最少也要4个。

RAID-6 是在RAID-5基础上把校验信息由一位增加到两位的raid级别。

RAID-6和RAID-5一样对逻辑盘进行条带化然后存储数据和校验位,只是对每一位数据又增加了一位校验位。这样在使用RAID-6时会有两块硬盘用来存储校验位,增强了容错功能,同时必然会减少硬盘的实际使用容量。以前的raid级别一般只允许一块硬盘坏掉,而RAID-6可以允许坏掉两块硬盘,因此,RAID-6 要求至少4块硬盘。

RAID-10

第五种:raid10,它必须是≥4的倍数块磁盘组成。

这个不读“RAID十”,读 “十”就不专业了,要读“raid一零”。它是RAID-0和RAID-1的组合,结合一起就很完美了。只是利用率没有RAID-5高,但是性能更好一些。我们知道,RAID-1是一个冗余的磁盘阵列,而RAID-0则负责数据的读写阵列。由于利用了RAID-0极高的读写效率和RAID-1较高的数据保护、恢复能力,使RAID-10成为了一种性价比较高的RAID。因此,RAID-10即高可靠性与高效磁盘结构它是一个带区结构加一个镜象结构,可以达到既高速又安全的目的,RAID-10能提供比RAID-5更好的性能。

RAID特性总结

0 人点赞