E9000产品CX311交换板(2X和3X)未堆叠组网情况下其中一块交换板外部链路故障情况下导致业务网络中断

发布时间:  2016-03-15 浏览次数:  194 下载次数:  0
问题描述

1.业务部署及组网情况:内部刀片分别有两张网卡与外部2X和3X交换板连接,交换板之间未做堆叠,由于E9000内部刀片部署的是华为虚拟化软件,刀片对外两张网卡设置为主备模式,也就是说刀片与外部交换板之间默认只有一条链路在跑业务,如果这条链路中断,内部刀片业务也将随之中断。

2.故障描述:现在外部2X交换板的上行接口(与交换机连接)的链路故障,由于此条链路是业务网络,另外一块3X交换板没有能够接管业务网络,导致业务中断。

告警信息


处理过程

1.分析故障原因: 经过检查2X和3X交换板的配置发现交换板的上行接口(接外部交换机)与下行接口(连接内部刀片)未配置到一个Monitor Link组。说明:(Monitor Link组也叫监控链路组,由上行接口和下行接口共同组成。组的成员可以是单接口、静态聚合组、手工聚合组或Smart Link组,其中Smart Link组只能作为上行接口。下行接口的状态随上行接口的变化而变化。)也就是说交换板的上行接口在未配置Monitor Link组的情况下,其中一个交换板的上行接口故障,与其对应的下行接口无法感知其链路故障,也就无法触发内部网卡的主备切换模式,从而导致业务中断。

2.处理方法:分别在2X和3X交换板上将上行接口和下行接口配置到一个Monitor Link组里,网络和业务恢复正常,经过对2X和3X的上行接口轮流插拔测试,业务网络正常无中断。

根因

2X和3X交换板的配置发现交换板的上行接口(接外部交换机)与下行接口(连接内部刀片)未配置到一个Monitor Link组,交换板的上行接口在未配置Monitor Link组的情况下,其中一个交换板的上行接口故障,与其对应的下行接口无法感知其链路故障,也就无法触发内部网卡的主备切换模式,从而导致业务中断。

解决方案

E9000刀片CX311交换板的2X和3X之间未做堆叠的情况下,如果想实现内部网卡的冗余作用,需分别在2X和3X交换板上将上行接口和下行接口配置到一个Monitor Link组里。此案例刀片内部部署的是华为虚拟化软件,如刀片部署其他业务系统请视情况而定。

建议与总结


END