S3700星型组网核心交换机与某台下挂交换机业务不通

发布时间:  2016-10-25 浏览次数:  297 下载次数:  0
问题描述

新开时钟业务,在H省各地市新增交换机并下挂时钟设备:

A地作为核心和网管所在对时钟设备进行管理。业务vlan采用vlan1000,交换机管理vlan采用vlan2,在vlanif接口下配置管理地址,并在下挂各交换机上配置远程登录功能,并配置默认路由为核心交换机管理地址。业务口采用access端口模式,交换机之间互连采用trunk端口透传业务和管理vlan组网如下:


中间通道开通和测试无误后,发现网管服务器无法管理到C地市BITS设备,在A地市服务器和核心交换机处ping测,发现无论是BITS设备地址还是C地市S3700交换机管理地址均无法ping通,其它站点均正常。

告警信息

处理过程

检查C地市交换机配置和C地市BITS设备地址以及A地市核心交换机与C地市互连接口是否配置正确,同时再次进行通道测试。经过排查设备数据配置和BITS设备ip地址配置正确无误;

在C地市和A地市2M协转侧连接笔记本进行通道测试,通道状态正常。更改互联端口为access口后,在C地市2M协转侧连接笔记本到时钟网管服务器测试通信正常,在A地市2M协转侧连接笔记本到C地市下挂BITS设备测试通信正常。

将互连端口更改为access模式,并绑定业务vlan1000,测试后发现BITS和网管服务器不能通信;绑定管理vlan2,测试后发现A地市S3700无法ping通C地市3700,同样无法通信。


上述方法无法定位故障原因,之后在A地市核心S3700交换机侧对与C地市互连端口Eth0/0/10,镜像进行抓包分析。

将链路和配置恢复到初始状态后,在进行ping测试时同时进行端口的镜像抓包。

通过抓包发现,无论是从时钟网管服务器pingBITS设备,还是在A地市核心S3700交换机ping测C地市S3700交换机,互联口均只有arp 请求包无法收到对端给的arp回应包。

在C地市侧进行ping测,并对仍对A地市核心交换机该端口inbound方向进行抓包,发现端口入方向除了大量stp协议数据包外并无任何对应arp请求包。

随后在A地市核心S3700交换机上查看设备stp端口状态


发现交换机连接C地市端口Ethernet0/0/10为转发状态,角色为指定端口,连接D地市端口Ethernet0/0/8为转发状态,角色为root根端口。

随后查看交换机stp状态发现网络中存在一台优先级为0的一台跟交换机



测试在处理过程中将连接D地市端口Ethernet0/0/8断开后,发现连接C地市端口Ethernet0/0/10端口角色变为root,网络中的根交换机仍然为同一台优先级为0,ID为:00d0-d0b4-c2dd的那台交换机,根据mac地址得知该交换机为中兴交换机。

由于优先级设置为0,所以该交换机在交换网络中直接成为根交换机,推测该交换机与C地市和D地市交换机实际中均通过网络有连接,实际拓扑为下图有物理环路的拓扑(vlan上不存在环路):


再次核实后得知,在C地市和D地市的交换机上还下挂了其它厂家的业务和设备

由于C地市交换机的上连端口计算为预备端口,所以不转发任何数据(其他业务vlan不同,中间并不会透传),导致C地市BITS设备不能与A地市网管服务器正常通信,而当断开D地市连接后环路消除,端口变为指定端口所以可以正常通信。

根因

实际网络中存在物理环路,存在一台优先级为0的中兴交换机作为根交换机,而华为S3700交换机stp均为默认配置。

stp在计算过程中将上行口计算为预备端口导致不转发任何数据,而中兴交换机配置的为其他vlan的业务,不会透传此业务vlan



解决方案
在A地市核心交换机上将与C地市交换机互联端口,设置为边缘端口或在该端口上关闭stp功能。
建议与总结

交换机组网出现业务不通的故障,如果其他方面均无问题,往往是由于STP引起的问题。

实际中组网情况和现场的实际应用情况比较复杂,不要根据自己的组网类型是个无环的网络,就轻易排除STP的影响。

END