服务器产品RH2288H V2(Imana 7.15版本)无法加电开机问题

发布时间:  2016-03-03 浏览次数:  254 下载次数:  0
问题描述
某局点一台RH2288H V2(Imana版本为(U1029)7.15,BIOS版本为(U102)V508,IPMI版本为2.0)服务器关机一段时间后开机无法加电,启动时风扇有转动声音但很快停止,几分钟后前面板故障灯显示为红色,登录BMC查看告警信息发现存在如下告警记录
2015/10/30 Fri 18:29:54 | Power Supply (PwrOn TimeOut) | Power supply failure | Asserted  Major
BMC远程接入管理显示为POWER OFF
多次重启均无法解决问题
告警信息
日志中有记录
2015/10/30 Fri 18:29:54 | Power Supply (PwrOn TimeOut) | Power supply failure | Asserted  Major
前面板故障指示灯显示为红色
处理过程
多次重新加电,彻底断电后重新启动,现象依旧
最小化测试,主板上仅保留一颗CPU、一根内存加电后仍然存在同样告警信息,无法加电
使用现场空闲服务器配件逐个替换电源模块、电源背板,单双电源接入均无法解决问题,后替换主板后依旧无法解决
使用现场其他服务器CPU替换时发现搭配原内存时可以启动,BMC中无告警,新旧CPU分别插入1、2号槽位也可以启动。换回原有主板,搭配新CPU依旧可以正常启动,结合替换主板无效判断可能与CPU故障有关,使用备件CPU替换后恢复正常,将除CPU外其他所有配件还原后故障排除

根因

后经分析发现CPU故障导致传感器错误,引发电源保护无法加电启动

解决方案

使用同型号空闲服务器配件在最小化配置下进行逐个配件的进行替换后,确定故障原因为CPU故障,替换CPU后故障现象消失,设备恢复正常使用

建议与总结
BMC告警信息有时并不一定能准确指出故障原因
一定情况下使用最小化测试的方法更容易判断出故障所在,及时进行处理

END