存储08-raid技术的演进

2020-03-31 16:29:11 浏览数 (1)

1.RAID1.0时代

假设上图为17块硬盘的一个存储,现描述如下:

1)磁盘0-7组成一个raidgroup0;在raidgroup0上又划分了lun0-1

2)磁盘8-15组成一个raidgroup1;在raidgroup1上又划分了lun2-3

3)有一块全局hotspare盘(磁盘0-15任意一块故障后,hotspare磁盘要马上顶上进行raid重建)

热备盘小知识:

1)热备盘可以分全局热备和局部设备

2)热备盘可以有多块

3)全局热备盘可以顶替所有raidgroup内的故障盘

4)局部热备盘只能顶替指定raidgroup内的故障盘

5)热备盘非必须,有热备盘相对于无热备盘安全一些(磁盘故障后换盘的时间可以拖久一点)

6)早些年的存储,磁盘故障后热备盘顶替上后,当故障盘更换后热备盘的数据还要回拷到更换后的盘

7)后来随着存储控制器系统的智能化升级,磁盘故障后热备盘顶替上后,当故障盘更换后热备盘的数据不需要回拷到更换后的盘;更换后的盘可以直接当热备盘,这样减少一次数据回拷

8)数据回拷非常影响存储的性能

raid1.0的特性描述:

1)以物理磁盘为组成raid的最小单元

2)存在热点盘(磁盘故障后,热备盘是热点盘;故障盘更换后,热备盘数据回拷到更换后的盘,此时热备盘和更换后的盘都是热点盘)

3)磁盘故障后raid重构时间非常久(早些年磁盘容量小也就几百G,几个小时就完成;现如今单盘容量基本都是1|2|4|6|8|10|16T,重构时间是原来的几十倍;数据重构时间越短,数据越安全;万一重构未完成期间又坏盘呢,祸不单行此时数据有很大的可能就废了;raid1.0非常弱智,哪怕故障盘里写了1bit数据,剩下的全盘-1bit的垃圾数据也要重构)

4)单个raidgroup内磁盘数量不能太多(这个很好理解,8块盘同时坏2块总比20块磁盘同时坏2块概率低;就好比1W辆车里面同时撞两辆比1亿辆车同时撞两辆概率低;所有传统存储时代,官方最佳实践都是8块盘,iops和故障率取一个平衡)

5)单个lun的iops非常低(不能跨raidgroup,因为单个raidgroup的盘又不能太多)

6)数据丢失概率大(因为坏盘后重构时间太久,尤其是大容量磁盘)

7)一般情况下,都需要有热备盘

备注:说了这么多,其实raid1.0的根子在于,它是早些年单盘容量不大时代的产物,已经无法适应现如今单盘容量过T的时代(重构时间太久,几天几夜,风险太大),需要迫切改进。大容量磁盘 传统raid卡做raid10是没有心理压力的;但是用大于2T的盘做raid5就是砸自己饭碗,除非数据不怕丢。无知者无畏,一顿操作猛如虎。

2.RAID1.5时代

假设上图为17块硬盘的一个存储,现描述如下:

1)磁盘0-7组成一个raidgroup0;磁盘8-15组成一个raidgroup1

2)raidgroup0和raidgroup1组成了storagepool

3)storagepool上又划分了lun0-3

4)有一块全局hotspare盘(磁盘0-15任意一块故障后,hotspare磁盘要马上顶上进行raid重建)

备注:其实storagepool里把raidgroup又逻辑切分了无数个小单元,这无数个小单元又相互组合出来lun0-3

raid1.5的特性描述:

1)raid1.0该有的特性raid1.5都有

2)raid1.5单个lun的iops要比raid1.0(raid1.0里单个lun的iops不能跨raidgroup,raid1.5里单个lun的iops可以跨多个raidgroup,raid1.5的lun可利用的物理磁盘比raid1.0要多)

备注:raid1.5仅仅是比raid1.0提升了单个lun的iops,重构时间太久风险太大的问题任然没有解决;存储管理员天天头上顶个大炸弹。

3.raid2.0时代

raid2.0特性描述:

1)把物理磁盘逻辑划分为一块一块的小逻辑硬盘chunk(单个chunk为几M),chunk为组成raid的最小单元

2)chunk在chunkgroup里组成各种raid小条带(如raid1:1D 1D,raid5:7D 1P,raid6:6D 2P,raid10:(2D 1D)*2,raid50:(5D 1P)*2,raid60:(6D 2P)*2等,并且不通的raid可以共用底层的物理磁盘)

3)lun由chunkgroup里的各种相同raid类型的小条带组成

4)无热点盘(磁盘故障后,剩余的所有磁盘参与重构)

5)重构时间段(第一无热点盘,参与重构磁盘多;第二raid2.0比较智能,只重构有效数据,垃圾数据不进行重构)

6)单个lun的iops非常高(因为lun横跨在底层所有的磁盘上)

7)数据安全可靠(因为坏盘后重构时间短)

8)无需单独的热备盘(所有盘都是热备盘和数据盘)

9)同一个物理磁盘上包含上次各种raid类型(raid1.0和raid1.5中,一个物理磁盘只能属于一个raid类型)

备注:现在的一些高端或者分布式存储基本上都是raid2.0技术。切记不要用大容量单盘做传统的raid1.0和raid1.5,即要命又砸饭碗。

0 人点赞