S3700交换机Eth-trunk两端成员口数目不一致导致二层网络中其他交换机脱管

发布时间:  2014-09-12 浏览次数:  640 下载次数:  35
问题描述
汇聚交换机为S5700SI堆叠,接入交换机为S3728EI,版本均为V100R005C01SPC100,补丁SPH016。汇聚交换机和接入交换机通过两条物理链路捆绑成eth-trunk互联。

故障发生时,接入交换机S3700脱管,即S3700到网关无法ping通。

下挂业务正常,接入的用户可以正常获取到IP,端口流量没有异常。

网关可以ping通S3700,并且ping通之后,S3700恢复正常,网管软件可以管理到接入交换机,但是arp老化之后再次出现脱管。
告警信息
设备无相关告警信息。
设备mac漂移到接入交换机的下行口上。
display 设备arp,会出现arp incomplete,并且接口信息错误。

dis arp
IP ADDRESS      MAC ADDRESS  EXPIRE(M) TYPE INTERFACE      VPN-INSTANCE     
                                       VLAN
------------------------------------------------------------------------------
10.67.10.4      0819-a608-7030         I -  Vlanif1
10.67.10.1      Incomplete      1      D-0  Eth0/0/14
                                       1
------------------------------------------------------------------------------
Total:2         Dynamic:1       Static:0    Interface:1  

处理过程
把S3700交换机两条上行链路都加入Eth-trunk1,故障排除。arp学习恢复正常。
根因
检查故障设备配置,发现该接入交换机配置无误,汇聚交换机配置无误。


由于15台接入交换机中3台发生该故障,于是逐个排查二层网络中的设备配置,发现有一台S3700交换机上行口eth-trunk只加入了一个成员口,另一个未加入,导致二层出现环路。
但是所有接口流量没有异常,均低于1%。配置错误的交换机工作正常,导致其他交换机发生故障,增加故障排查难度。
建议与总结
配置需仔细检查,堆叠环境中极易发生连线错误导致的环路,需谨慎操作。

在堆叠设备开局中,建议提前准备好标签,按照标签信息连接设备到堆叠主备,减少连接人为失误。

在条件允许的情况下,建议堆叠主备框设备接线采用不同颜色的网线,便于排查和维护。

END