存储18800硬盘框SES级联模块异常导致风扇告警故障

发布时间:  2015-12-16 浏览次数:  237 下载次数:  0
问题描述

硬盘框报风扇故障,进行备件更换后,再次告警风扇故障。

告警信息

2015-11-04 13:44:12    0xf0d30004    Major    2015-11-26 10:15:31    The fan module (Disk Enclosure DAE100, fan module FAN 1) is faulty with error code (0x4000d301). This may cause the temperature of the enclosure to exceed the upper limit.
2015-11-26 10:16:38    0xf0d30004    Major    2015-11-26 10:21:17    The fan module (Disk Enclosure DAE100, fan module FAN 1) is faulty with error code (0x4000d301). This may cause the temperature of the enclosure to exceed the upper limit.

处理过程

1.收集日志,并对日志内容分析:

114日出现DAE100的风扇1故障

///[1a8][15.11.04.13:44.09] [0x53c84be2] Fan 1 alert change: 0 to 1

///[1a9][15.11.04.13:44.09] [0x53c84be2] Fan 1 speed read:5160,5880.speed set :5760 ,11520

///[1aa][15.11.04.13:44.09] [0x53c84be2] fan 1 alarm, pwm set 0x2f 0x7f, pwm read 0x2f 0x7f speed 5160 5880, level 3,15

//[1ab][15.11.04.13:44.09] [0x53c85406] fan abnormal num change from 0 to 1

 具体原因为SES模块对风扇1调速失败(调速的设定值与读取值不符合)。

 26日客户更换备件后,DAE100风扇1又再次故障

2015-11-26 10:16:38    0xf0d30004    Major    2015-11-26 10:21:17    The fan module (Disk Enclosure DAE100, fan module FAN 1) is faulty with error code (0x4000d301). This may cause the temperature of the enclosure to exceed the upper limit.

原因依然为SES模块对风扇1调速失败(调速的设定值与读取值不符合)


根因

此处级联模块指“级联A/B”控制器

硬盘框风扇调速如图,是由主SES级联模块来进行调速,现网主级联模块为级联模块B

调速失败的可能原因:1、风扇模块本身故障(前期更换过,嫌疑较小);2、级联模块B异常;3、插框异常(嫌疑较小)

建议与总结

申请级联模块(控制器)与风扇备件(推荐使用SVP上的OceanStor Toolkit工具进行备件更换)

1、 先更换级联模块B(DAE100上有两个级联模块,相对位置在下方的级联模块),看告警是否恢复。

注意:更换级联模块动作建议选择业务压力小的时间段进行。

2、 若告警不恢复,更换故障风扇

END