RH5885 4核安装win2012(2 cpu)业务量大时死机

发布时间:  2013-09-29 浏览次数:  278 下载次数:  1
问题描述
南京某局点RH5885,配置4 CPU,客户反馈设备刚调试上架,服务器安装windows server 2012系统,部署orcle数据库,做档案存取业务,故障现象是访问压力一上升就死机,客户业务受影响。客户反馈业务最大访问量100用户左右,用户访问一半左右RH5885 就死机。
告警信息
处理过程

通过现场排查硬件无任何异常,数据库配置也没什么错误,通过排查判断为操作系统问题,客户安装的系统为Windows Server Standard 2012 (2CPU),而RH5585配置了4个CPU,业务量大时导致操作系统对CPU调度异常导致服务器死机。
排查过程:
一.排查硬件,登陆BMC查看硬件是否存在告警。
二、排查orcle配置是否正常。
三、.两者都排查后都不存在问题,怀疑操作系统问题,查看客户安装操作系统如下:



客户RH5885硬件配置4 CPU,RH5585 CPU可选配2个或4个,如图:

说明:
选配两个CPU时,CPU及内存板满足以下配置原则:
1.当选配两个CPU时,可以选配CPU1与CPU2,或选配CPU1与CPU4。
3.与选配的CPU配对的内存板接口处可以插内存板,其他位置插内存板无效。CPU1与6、7号内存板接口配对,CPU2与4、5号内存板接口配对,CPU3与2、3号内存板接口配对,CPU4与0、1号内存板接口配对。
3. 内存板接口21(从下到上编号为1~8、端口丝印从J201开始以2递增)

四、重新安装配套的操作系统,因客户无Windows Server Standard 2012 (4 CPU)系统,现场安装win2008操作系统,重新部署orcle数据库来运行业务进行测试,经过一周的大业务量测试,业务运行正常,客户后续就使用win2008系统来运行业务。

根因
业务量大时操作系统对CPU调度异常导致服务器死机。
建议与总结
处理建议:服务器一定要安装配套和兼容的操作系统。

END