RH2288A V2服务器LSI2208卡RAID组成员盘在线变更槽位导致硬盘告警无法恢复

发布时间:  2015-12-31 浏览次数:  137 下载次数:  0
问题描述

某局点一台RH2288A V2配置LSI 2208卡,使用5块硬盘(Slot0-4)做RAID5,在做故障演练的时候做了如下操作:业务系统开机状态下将Slot3硬盘拔出,触发iBMC上报Disk3 In Failed Array告警。将拔出的Slot3槽位更换至Slot5,并清除该硬盘被标记的外部RAID配置信息,将Slot5设备为热备盘,RAID5重构后状态恢复正常,但iBMC依然上报Disk3 In Failed Array告警。iBMC告警如图所示:


此时去RAID卡WEBBIOS管理界面查看RAID组状态完全正确,如图:


处理过程

按照如下操作即可恢复故障告警

1)服务器关机,将所有硬盘拔出(脱离硬盘背板即可)。

2)服务器开机,通过Ctrl+H快捷键进入RAID卡配置界面,通过Configuration WizardClear Configuration清除RAID卡记录的原RAID配置信息。

3)服务器关机,将所有硬盘插回。

4)服务器开机,通过Ctrl+H快捷键进入RAID卡配置界面,导入硬盘RAID配置信息。

根因

据分析:RAID卡会记录RAID组每个成员盘的槽位信息,当RAID组一个成员盘掉盘,尽管其他槽位的热备盘/紧急备份盘可以参与重构,使得RAID组恢复正常,但是原成员盘槽位依旧会亮灯告警,iBMC告警DiskN in failed array(N表示硬盘物理槽位编号),该机制是用来提示用户该槽位曾经有一个RAID组成员盘,且没有被恢复,表明硬盘当前槽位配置与最初槽位配置存在差异。

解决方案

在设备关机的情况下,将所有硬盘拔出,在RAID卡配置界面清除RAID卡现有的配置,再关机将所有硬盘按照原槽位插入,再导入硬盘上的RAID配置信息即可

END