RH2288H V3服务器4个风扇同时告警

发布时间:  2016-03-30 浏览次数:  290 下载次数:  0
问题描述

一台RH2288H V3服务器在设备开局上电的时候发现设备健康状态指示灯亮红灯,切伴随有风扇声音很大,登陆服务器管理界面iBMC查看,发现4组风扇同时有告警。如图:


 

 

处理过程

排查步骤如下:
1) 重新安装4个风扇,问题未解决。
2) 查看当前BMC版本为1.91,升级到2.01后,问题未解决
3) 询问客户近期是否有安装高功耗设备,反馈只新增了部分内存和两块82599网卡,且不确认何时产生告警。
4) 检查部件信息,PCIe设备只有两块82599网卡,无高功耗设备:


5) 检查部件信息,风扇型号为8056(BOM:02310YKN)且风扇转速很高:


6) 检查部件信息,CPU配置为2颗E5-2690 V3:


7) 查看出厂记录,出厂时CPU配置为1颗E5-2620 V3:


从以上信息可知,风扇告警原因是出厂时低功耗的CPU E5-2620 V3(TDP:85W)被改配成了高功耗的CPU E5-2690 V3(TDP:135W),而风扇没有从适配低功耗的8056型号(BOM:02310YKN)改配成适配高功耗的8056 plus型号(BOM:02310YKP),从而导致BMC中风扇告警

根因

CPU从低功耗型号改配成高功耗型号,而风扇型号没有对应调整,导致BMC中出现风扇告警。高功耗的CPU搭配8056风扇使用从而导致BMC中4个风扇同时告警

解决方案

高功耗的CPU搭配8056风扇使用从而导致BMC4个风扇同时告警。将风扇从8056BOM02310YKN)换成8056 plusBOM02310YKP)故障恢复。

建议与总结

同时4个风扇出现告警,可以从以下几个方面排查:

1)安装了不支持的风扇;

2)安装了当前风扇不支持的PCIE卡(高功耗散热搞不定);

3)安装了当前风扇不支持的CPU(高功耗散热搞不定);

4)不同型号的风扇混插。

注:

以下型号的CPU功耗不小于135W,不能搭配8056风扇(BOM02310YKN)使用,必须使用8056+风扇(BOM02310YKP):

E5-2690 V3TDP135W

E5-2699 V3TDP145W

E5-2698 V3TDP135W

E5-2697 V3TDP145W

E5-2667 V3TDP135W

E5-2643 V3TDP135W

E5-2637 V3TDP135W

 

END