存储S2600T(V1R5)同步远程复制故障导致业务中断

发布时间:  2015-07-08 浏览次数:  128 下载次数:  3
问题描述

某局点S2600T同步远程故障导致业务中断,存储设备前端指示灯有告警提示,通过ISM软件查看告警信息,发现主备存储未有告警信息。

组网信息:

告警信息

处理过程

   1、通过提取密码机日志信息,发现是由于密码机与存储之间由于I/O量下发过大导致I\0超时导致无法读取数据。

   2 确认密码机与存储之间链路是否正常,发现主存储与密码机是网线直连,更换密码机端口及存储端口、更换网线,发现问题依然存在。

   3、通过提取存储日志信息发现,是备存储I/O量下发过大有I/0超时情况,由于远程复制原理是密码机发出请求时先写到备存储,再写到主存储,一旦备存储I/0超时而不是全部中断,就无法读取数据,导致业务中断。

   4、通过测试先吧备存储中断,只使用主存储,测试2天后发现业务正常,无中断情况。

   5、通过排查主存储到备存储之间链路,最后发现是由于光衰过大造成I/0下发超时,从而导致业务中断。

   5、通过更换纤芯把光衰处理在正常范围值后再接入环境中,业务正常。

根因

通过密码机日志信息分析,是由于密码机下发的I/O信息未得到回应,导致数据无法读取,业务中断,怀疑密码机与存储之间是否存在问题。

解决方案

通过更换纤芯把光衰处理在正常范围值后再接入环境中,业务正常。

建议与总结

1.建议是在同一机房内使用同步远程复制,避免链路问题导致性能瓶颈,对实际业务的性能有非常大的影响

END