服务器RH5885V2宕机处理

发布时间:  2016-05-20 浏览次数:  162 下载次数:  0
问题描述

3RH5885 V2服务器,外插多张网卡插上网线使用bond配置后,windows2012系统日志中有网卡相关告警信息持续报错,当报错数量达到一定数量出现宕机现象。

系统显示的告警信息:

处理过程

(1)首先排查硬件侧,收集BMC日志,显示硬件无告警,OS日志显示系统关机事件。

(2)排查网卡数量和槽位选择的影响。

测试如下:

1.使用单张网卡测试,操作系统不会上报告警。 使用两张或者三张网卡测试,操作系统会上报告警,与数量有关。更换网卡槽位测试,故障现象一致。与槽位摆放位置无关,更换了IOH板,故障现象一致,与IOH板无关。

(3)     更换网卡驱动,为Intel82576网卡

1.查看操作系统自带网卡驱动不是最新的,升级到最新驱动 https://downloadcenter.intel.com/download/21694/Network-Adapter-Driver-for-Windows-Server-2012-,发现故障未消除。排除驱动的问题。

(4)bond配置侧

     使用配置bond与不用bond配置,故障都会出现。

(5)操作系统侧

1.使用Windows 2012镜像+安装两个升级补丁后,依然会出现告警,只是告警频率没有之前频繁。当告警达到一定数量时,还会出现告警,没有根本解决问题。

2.重装系统Windows2012R2版,告警消除。

根因
特定场景下(RH5885 V2与因特尔多网卡环境+Windows2012系统),与Windows版本不兼容。现场多网卡环境因特尔组件在Windows 2012系统下不支持。
解决方案
更换操作系统,从Windows 2012升级到Windows 2012 R2即可解决。
建议与总结
在处理这种表象不在硬件上的而在系统上,需要去从系统环境侧去测试

END