一:案例描述 客户向我们反馈他们的华为OceanStor Dorado存储系统RAID-TP故障,导致数据丢失,希望能够帮助他们进行数据恢复。
二:解决方案 1.案例评估 1)RAID-TP介绍 RAID(冗余独立磁盘阵列)是一种用于提高数据可靠性和性能的存储技术。其中,RAID-TP是一种较新的RAID级别,特别针对闪存存储系统设计。它在RAID-6的基础上,增加了一个校验盘,从而实现了更高级别的数据保护。RAID-TP阵列由三部分组成:数据磁盘、校验磁盘和转换磁盘: 数据磁盘:数据磁盘是存储主要数据的磁盘; 校验磁盘:校验磁盘用于存储数据磁盘中数据的校验信息,如果数据磁盘损坏,可以通过校验磁盘来恢复数据; 转换磁盘:转换磁盘用于存储数据磁盘和校验磁盘之间的转换信息,以提高数据恢复的效率。 2)RAID-TP的工作原理 数据写入:当数据写入RAID-TP阵列时,数据被切分为多个块,这些块被平均写入到各个数据磁盘中。同时,系统会对这些数据块进行校验,生成校验信息,并将校验信息写入到校验磁盘中。此外,系统还会根据数据块和校验信息生成转换信息,并将转换信息写入到转换磁盘中; 数据读取:当读取数据时,系统会从数据磁盘中读取数据块,然后根据转换信息从校验磁盘中获取校验信息,以此来校验读取的数据是否正确。
2.恢复方案 华为OceanStor Dorado V6存储系统采用动态RAID技术实现冗余设计,根据RAID中检验位的个数不同提供不同的保护级别。存储系统提供3种保护级别,RAID 5、RAID 6和RAID-TP。RAID-TP自动校验的数据恢复过程,如果数据磁盘损坏,系统可以通过以下步骤恢复数据: 1)系统首先从校验磁盘中读取校验信息,然后根据转换信息,计算出损坏的数据块; 2)然后系统将恢复的数据块写入到新的数据磁盘中,完成数据的恢复。 目前没有可以支持RAID-TP的数据恢复软件,可以根据以下结构进行自定义RAID重组:
三:案例总结 华为OceanStor Dorado V6存储系统采用动态RAID重构技术(也称缩列重构技术),重构粒度为CK。即存储池总的可用硬盘小于RAID成员盘数,缩列重构时保持M(校验列)不变,减少N(数据列)的方式进行重构,重构前后RAID校验列数不变,数据列数变少。缩列重构完成后,RAID组成员盘数减少,但是RAID冗余级别不变。当故障盘更换完成后,系统会根据存储池内的可用硬盘数,增加N(数据列),新写数据就会采用新的RAID方式,故障期间写的数据也会逐渐转换为新的RAID方式。