RH2285服务器CPU故障导致网络加载系统异常

发布时间:  2016-03-21 浏览次数:  144 下载次数:  0
问题描述

通过网卡从网络加载系统时报BANK5BANK8错误,系统无法成功加载。


告警信息

处理过程

排查PCI-E设备:
1.
将服务器下电,重新插拔网卡扣卡,服务器重新上电启动依然报BANK5BANK8错误。
2.
将服务器下电,重新插拔RAID卡,服务器重新上电启动依然报BANK5BANK8错误。
3.
将服务器下电,更换网卡扣卡,服务器重新上电启动依然报BANK5BANK8错误,排除网卡扣卡故障。
4.
将服务器下电,更换RAID卡,服务器重新上电启动依然报BANK5BANK8错误,排除RAID卡故障。
经过以上分析可说明故障与PCI-E设备无关。

排查内存及CPU:
1.
将服务器下电,重新插拔所有内存,若服务器重新上电启动依然报BANK5BANK8错误,执行步骤2;否则需要通过逐根插拔内存条,确认是否内存故障。
2.
将服务器下电,对CPU进行如下操作(CPU不在位,那么其对应的内存不会被使用),并记录操作的结果。


3. 将更换下来的CPU2安装到正常服务器(排除主板故障),正常服务器上电启动报BANK5BANK8错误。
由以上分析可以得知CPU2故障,需要更换CPU2

根因

CPU故障导致BANK5BANK8错误

解决方案

1.排查PCI-E设备

2.排查内存及CPU

建议与总结

对于CPUBANK码错误的故障,可以根据BANK码来缩小故障排查范围。根据MCE码释义,CPUBANK5表示故障与PCI-E设备相关,BANK8表示与内存及内存控制器相关,排查过程分为PCI-E设备、内存、CPU三部分排查。

END