LSI 2208卡RAID组成员盘在线变更槽位导致硬盘告警无法恢复案例

发布时间:  2016-05-28 浏览次数:  241 下载次数:  0
问题描述

RH2288A V2配置LSI 2208卡,使用5块硬盘(Slot0~4)做RAID5,业务系统开机状态下将Slot3硬盘拔出,触发iBMC上报Disk3 In Failed Array告警。将拔出的Slot3槽位更换至Slot5,并清除该硬盘被标记的外部RAID配置信息,将Slot5设备为热备盘,RAID5重构后状态恢复正常,但iBMC依然上报Disk3 In Failed Array告警。如图:


但是RAID5的状态又是完好的,如图:


处理过程

处理过程见解决方案

根因

RAID卡会记录RAID组每个成员盘的槽位信息,当RAID组一个成员盘掉盘,尽管其他槽位的热备盘/紧急备份盘可以参与重构,使得RAID组恢复正常,但是原成员盘槽位依旧会亮灯告警,iBMC告警DiskN in failed arrayN表示硬盘物理槽位编号),该机制是用来提示用户该槽位曾经有一个RAID组成员盘,且没有被恢复,表明硬盘当前槽位配置与最初槽位配置存在差异。

解决方案

按照如下操作方法进行恢复:

1)服务器关机,将所有硬盘拔出(脱离硬盘背板即可)。

2)服务器开机,POST阶段通过Ctrl+H快捷键进入RAID卡配置界面,通过Configuration WizardClear Configuration清除RAID卡记录的原RAID配置信息。

3)服务器关机,将所有硬盘插回。

4)服务器开机,POST阶段通过Ctrl+H快捷键进入RAID卡配置界面,通过Scan Drives→Preview→Import导入硬盘RAID配置信息。

建议与总结

此案例适用于所有配置LSI2208 RAID卡的Tecal V2/V3系列服务器

END