【渠道服务大比武】备光纤交换机断电导致业务宕机

发布时间:  2014-09-04 浏览次数:  292 下载次数:  0
问题描述
本次项目中,两台光纤交换机采用全冗余组网,确保不存在单点故障,而且两台光交分别独立供电:一台光交采用市电,一台光交采用UPS供电。客户反映的现象是,有一次UPS故障,对应的光交掉电了,同时整个业务系统宕机了,后来他们测试过多次,还是出现同样的现象。具体拓扑图如下:


告警信息
备份光纤交换机宕机后,ISM侧出现各种告警!
处理过程
因为在同一台交换机中,只能同时激活一个ZoneSet,因此:将前端后端zone划分到一个zoneset,激活后能解决问题。

根因

经过巡检存储设备和光纤交换机,发现故障出现在光纤交换机上面:整个组网配置未能保证全路径冗余组网,这样,一个交换机故障之后,另外一个交换机因为没有跟主机的连接,导致业务中断。具体分析如图:
ZoneSet设置:


第一台光交只激活了前端ZoneSet,第二台光交只激活了后端ZoneSet。



建议与总结
针对此次项目出现的宕机事件,我们发现,问题的出现是配置问题,因为,一方面,在以后的项目中,我们应该更加仔细的检查各项配置,确保没有问题,同时,在配置完成之后,要做业务倒换测试,测试各种极端情况下业务能否正常运行。这样就可以在项目之初将问题解决,避免了后面出现严重的事故,造成不必要的损失。

END