某局点服务器硬盘误拔出导致硬盘告警

发布时间:  2015-05-22 浏览次数:  847 下载次数:  0
问题描述

用户误将RH5885v2服务器的一块硬盘拔出,过一个小时再插回去,服务器鸣叫,插回去的硬盘告警。

告警信息

显示告警:Hard disk drive fault
 

处理过程

1、重启服务器按“Ctrl+H进入RAID配置界面(WebBIOS)。发现新插回的硬盘显示PD Missing














2、选中如图中显示为黑色的盘,并选中Properties选项,点击GO

  

 

3、选中Make Unconf Good选项,点击GO,如下图

 


 

4、选中Replace Missing PD,点击GO,如下图

 

 
5、选中Make Online,点击GO,如下图
 


 

6、选择YES,此时磁盘显示online,告警消失,服务器停止鸣叫。
 



7、数据一致性校验。选中左侧的Virtual Drives,选择Check Consistency,点击GO,如下图。

 

 

8、查看Abortprogressoperation,当VDO%checkconsistencyprogress100%完成数据一致性校验。
 

9、重启服务器正常进入系统。

根因

服务器硬盘拔出后再插回去,服务器发现该硬盘非新硬盘,PD missing:backplane,slot0(热插拔,丢失状态)RAID卡无法同步。出于保护机制,不会采取自动同步措施且插回去的硬盘显示offline。当重新online,为了验证被拔硬盘,操作系统会提示异常关机。此时被插拔的硬盘有损系统文件造成系统无法正常进入。通过进行数据一致性校验,可以保证RAID1的成员盘数据一致即被插拔的硬盘和原硬盘数据同步。

解决方案

1、 将硬盘online
 

2、进入数据一致性校验。

建议与总结

服务器硬盘误拔出后,为不影响业务可插入新硬盘让其自动同步。如果无新硬盘,待业务空闲期迁空服务器上业务,进行重启服务器操作,期间服务器离线一个多小时。

END