OceanStor 9000“Insufficient Redundant Data Copies Cause a Data Recovery Failure”告警处理

发布时间:  2015-09-04 浏览次数:  131 下载次数:  0
问题描述

上报告警为同一内容,ID 73015099401。内容如下:

2015-07-01 10:13:02 Insufficient Redundant Data Copies Cause a Data Recovery Failure: Data on the disk in slot (19) of device (C-Node-06) does not have sufficient redundant copies, so the data fails to be recovered.
2015-07-01 14:02:55 Insufficient Redundant Data Copies Cause a Data Recovery Failure: Data on the disk in slot (3) of device (C-Node-06) does not have sufficient redundant copies, so the data fails to be recovered.
2015-07-01 18:17:10 Insufficient Redundant Data Copies Cause a Data Recovery Failure: Data on the disk in slot (11) of device (C-Node-06) does not have sufficient redundant copies, so the data fails to be recovered.


客户现场OceanStor 9000磁盘策略为“+2:1”,3块磁盘同时告警,很可能导致业务中断。

告警信息
(ID 73015099401)“Insufficient Redundant Data Copies Cause a Data Recovery Failure”。
处理过程

从日志分析结果来看,在告警上报的这个时间段,6号节点的三块硬盘上部分数据冗余块写入时出现逻辑错误,导致系统上报相应的告警。

但是,在后面的一次写入数据冗余块至这些位置时,写入成功(即能正确将这些块填充),这些位置块不再出现写入逻辑错误。(对应日志打印如下)


2015-07-02 08:18:09 The disk in slot (3) of device (C-Node-06) data recovery is over.
2015-07-02 08:18:38 The disk in slot (19) of device (C-Node-06) data recovery is over.
2015-07-02 08:18:49 The disk in slot (11) of device (C-Node-06) data recovery is over.


通过对系统日志的排查以及相关硬盘的全面分析,系统各方面运行情况正常,硬盘物理状态正常。


OceanStor 9000中对于此类告警的处理是不自动进行清除,需要手动清除这些告警,因此,请手动将这些告警清除即可。 客户业务不受影响。

根因

OceanStor 9000中对于此类告警的处理是不自动进行清除,需要手动清除这些告警。

解决方案

OceanStor 9000中对于此类告警的处理是不自动进行清除,需要手动清除这些告警,因此,请手动将这些告警清除即可。

该告警诱发因素并不止是硬盘数据块的逻辑写错误,也可能是硬盘的硬件故障,目前的版本,对于该问题只能具体问题具体分析。

建议与总结

该告警诱发因素并不止是硬盘数据块的逻辑写错误,也可能是硬盘的硬件故障,目前的版本,对于该问题只能具体问题具体分析。

同时,为确保设备在局点的稳定运行、做好可能存在风险时提前发现,华为建议后续可以定期对设备进行巡检。

END