OceanStor 5600V3设备B控制器在DeviceManager界面显示为红色,控制器健康状态显示为Fault

发布时间:  2015-11-10 浏览次数:  193 下载次数:  0
问题描述

OceanStor 5600 V3设备B控制器在DeviceManager界面显示为红色,控制器健康状态显示为Fault


告警信息


处理过程

分析告警日志,设备近半年以来,无任何故障相关告警,查找与B控制器相关事件,在xxxx-xx-xx xx:xx:xx时,B控制器内存发生过单bit ECC错误。


ECC(Error Checking and Correcting),中文名称为“错误检测和纠正”,是一种能够实现“错误检查和纠正”的技术,是内存、CACHE或其他存储介质的一种错误校验检测机制。算法由硬件实现,一般集成在内存控制器上,对单bit数据错误可以自动修复,不需要人为处理。

进一步分析日志,发现B控制器健康状态显示为Fault正是因为控制器发生过单bit可修复ECC错误所致。

控制器健康状态显示为Fault,是指控制器发生硬件故障,DeviceManager界面会将控制器标识为红色,提示更换。

控制器健康状态显示为Fault,DeviceManager界面控制器被标识为红色,对业务以及性能无影响。




根因

小结:控制器内存发生单bit可修复ECC后,系统错误地将控制器状态置为Fault,导致DeviceManager界面B控制器被标识为红色。


控制器内存发生单bit ECC后,系统已自动修复(对业务以及性能无影响),但是软件将控制器状态错误地置为Fault,导致DeviceManager界面控制器被标识为红色。

解决方案

升级到OceanStor V300R001C20SPC200软件版本,该版本预计2016年年初发布。

END