RH2288H V2 VMware ESXi5.x系统自带2208RAID卡驱动问题引发紫屏

发布时间:  2016-11-28 浏览次数:  205 下载次数:  0
问题描述

问题现象:
客户现场发生如下紫屏:
0x4122086db3b0:[0x41803bcf8f6f]megasas_reset_fusion@<None>#<None>+0x1e stack: 0x108482440

0x4122086dbf60: [0x41803b95aac3]vmklnx_workqueue_callout@com.vmware.driverAPI#9.2 +0x11a stack :0x0

0x4122086dbff0: [0x41803b44842f]helpFunc@vmkernel#nover+0x52e stack: 0x0

0x4122086dbff8: [0x0],< unknown >  stack: 0x0


告警信息

告警信息:

0x4122086db3b0:[0x41803bcf8f6f]megasas_reset_fusion@<None>#<None>+0x1e stack: 0x108482440

0x4122086dbf60: [0x41803b95aac3]vmklnx_workqueue_callout@com.vmware.driverAPI#9.2 +0x11a stack :0x0

0x4122086dbff0: [0x41803b44842f]helpFunc@vmkernel#nover+0x52e stack: 0x0

0x4122086dbff8: [0x0],< unknown >  stack: 0x0

处理过程

BMC日志可能相关的只有问题发生时间附近的二条重启记录,没有异常信息:

bf | 2016/06/28 Tue 10:33:34 | System Boot / Restart Initiated (SysRestart) | System restart,cause unknown,command from ch #0 | Asserted  Ok

be | 2016/06/28 Tue 10:33:34 | System ACPI Power State (ACPI State) | S0 state | Asserted  Ok

bd | 2016/06/28 Tue 09:11:07 | System Boot / Restart Initiated (SysRestart) | System restart,cause unknown,command from ch #0 | Asserted  Ok

bc | 2016/06/17 Fri 00:06:50 | Power Supply (PS1 Status) | Power Supply input lost (AC/DC) | Deasserted

在google上搜索了一下,VMware官网KB有相同问题的说明:

https://kb.vmware.com/kb/2052368


通过vm-support日志文件夹中..\commands\localcli_software-vib-list.txt 或者localcli_software-vib-get.txt文件确认scsi-megaraid-sas 驱动版本是5.34-4,早于6.501.51.00

scsi-megaraid-sas 5.34-4vmw.510.1.12.1065491 VMware VMwareCertified 2013-11-11

建议客户用iDriver对应ESXi5.1版本升级一下,实际升级后问题解决。

根因
2208卡驱动bug引发紫屏
解决方案
使用iDriver进行升级
建议与总结
OS安装前尽量推动客户用ServiceCD引导安装系统,系统已安装默认驱动的情况下尽量推荐客户使用iDriver升级

END