XX局点1台S2600T因存储session用尽导致iscsi连接失败案例

发布时间:  2014-11-29 浏览次数:  568 下载次数:  0
问题描述
   开局后友商刀片服务器上windows server 2008操作系统iscsi连接失败,存储无异常告警,服务器包Iscsi pdu出错,如下图:
ISCSI连接异常图示
操作系统日志报错信息

现场组网图
处理过程
1. 针对现场组网网络环境,对现场网络进行抓包测试,发现网络链路不稳定。
2. 对操作系统按照微软方法收集Iscsi异常日志,进行分析发现iscsi连接异常。

经微软官方确认为:需要打补丁解决该问题。具体参照以下案列。
http://support.microsoft.com/kb/2957560
http://support.microsoft.com/kb/2908783
http://support.microsoft.com/kb/2684681
http://support.microsoft.com/kb/2673977
http://support.microsoft.com/kb/2277122
http://support.microsoft.com/kb/2614956
http://support.microsoft.com/kb/2536875
3、经过存储日志搜索关键字”free session”确认。由于链路不稳导致多次(100K次级别)和存储建立链接,触发存储内部bug,导致链接资源泄漏。
[2014-11-03 12:44:22][4428864425][15000000d0022][INFO][Unable to handle link up, because there is no free session available.][TGT][TGT_LinkUp,2324]
根因
1. S2600T存储(V100R005C01SPC700)存在iscsi session用尽,导致链接资源泄漏。
2. 客户操作系统windows server 2008 R2 sp1的iscsi(6.1 內部版本 7600)启动器的bug存在已知问题。
建议与总结
1:针对第一种问题,建议现场采用标准组网环境或者求助友商解决。
2、针对第二个问题,建议客户安装微软提供的补丁包。
3、针对第三个问题,可以采用以下处理方式:
应急措施:
复位控制器。现场设备上2个控制器都出现了这个问题,需要依次复位2个控制器。
根本解决措施:
停业务离线控制器版本到V100R005C02SPC300+ V100R005C02SPH302(SPH302补丁包含了SPH301补丁解决的问题)

END