早晨突然发现业务异常无法正常访问,检查发现服务器网络无法访问,机房查看服务器出现以下告警,并且硬盘盘位1 、2 亮黄灯(两块硬盘为raid 1,生产数据无备份!!!)
The following VDs are missing:000 If you proceed (or load the configuration utility ),these VDs will be removed from your configuration. If you wish to use them at a later time,they will have to be imported . If
you belive these VDs should be present ,please power off your system and check your cables to ensure all disks are present. Press any key to continue,or 'C' to load the configuration utility .
Enter Your Input Here:
重启服务器后,仍然无法进入系统,识别不到硬盘
远程登录BMC 查看系统报错日志
BMC 管理地址
默认地址:192.168.70.125
默认用户/密码:USERID/PASSW0RD
BMC 硬盘报错如下:
The Drive 0 has been disabled due to a detected fault
目前大多数控制器的实现是将RAID信息同时记录在控制器与硬盘上,这样当两者中有一出故障,可通过另一份COPY还原。同时可对RAID信息的正确性进行校验,通过控制器上存储的RAID信息为主信息,当RAID里的信息与硬盘里的信息不相同时,需要手工进行判断处理(比如强制上线)。此类情况更换硬盘盘位后,要么自动调整过来,不影响数据,要么需要手工确认一下。只要正确操作,便不会有数据灾难。
修复步骤
由于现场条件有限,没有拍照记录,参考官方文档介绍修复思路
开机后,注意引导界面,按F1键进入BIOS进行设置
进入BIOS后,选择system setting--storage ,进入磁盘阵列配置界面,可以看到M5210阵列卡
一、Lenovo logo机型进入SAS RAID配置界面
启动服务器,在出现Lenovo System x logo的时候按F1键进入UEFI Setup界面;
进入"System Settings";
再进入"Storage";
会出现SAS RAID卡配置项,如下图中的"ServeRAID M5210";
接下来即进入UEFI HII SAS RAID阵列配置界面,下图为Dashboard界面;
旧版本SAS RAID卡固件没有Dashboard界面,会直接进入Main Menu界面;
"Configuration Management"是配置RAID设置
"Controller Management"是对SAS RAID控制器进行设置
"Virtual Drive Management"是查看、调整RAID设置
"Drive Management"是查看、调整硬盘设置
"Hardware Components"是查看、调整RAID卡部件设置
十一、修复掉线的硬盘
本节介绍修复如在服务器运行中因误拔插所致的单一硬盘掉线的操作。
硬盘掉线会在硬盘托架上亮黄灯(不论是正常硬盘因误插拔掉线还是硬盘故障),此时对于非RAID0阵列则会处于"Degrade"状态或者"Partial Degrade"状态。
注意:如果二个及以上的硬盘掉线,导致阵列已经处于"Offline"状态,意味着阵列已崩溃。建议寻求专业数据恢复进行修复,仅当数据没有重要性时可参考本节内容进行操作。
进入"Drive Management"查看,被误插拔的硬盘状态是"Unconfigured Bad"。进入此硬盘。
在"Operation"中选择"Make Unconfigured Good"将此硬盘重置为可用状态。
然后在下一行出现的"Go"上按回车键,"OK"确认。
返回阵列卡配置主界面,再进入"Drive Management",查看此硬盘变为"(Foreign), Unconfigured Good"状态。原因是此硬盘带有了与本机已有阵列不匹配的信息,需要进一步操作。
返回阵列卡配置主界面,进入"Configuration Management",再进入"Manage Foreign Configuration"。
选择"Preview Foreign Configuration"查看并确认信息再进行导入。
确认掉线硬盘中的信息与现有阵列的信息一致,然后选择"Import Foreign Configuration"导入,并确认操作。
再次返回"Drive Management"查看,此硬盘就会处于"Rebuilding"状态进行修复了,修复时间会根据硬盘容量、性能及业务负载等情况不同而有较大差异。
至此,硬盘修复上线,系统正常启动,业务恢复访问,数据无价 谨慎备份!!!