S9712连接DELL windows server服务器时配置STP的情况下产生广播风暴

发布时间:  2016-02-26 浏览次数:  192 下载次数:  2
问题描述
拓扑如下图所示,两台S9700设备通过两条10GE线路互联,两条10GE线路捆绑成Eth-Trunk;两台S9700分别下挂一台S7502E、通过VRRP对下行服务器做网关冗余,服务器双网卡接入到两台S7502E。S9712设备上启用STP,服务器使用windows server系统,Windows服务器使用双网卡桥接的方式接入。
网络连通后出现广播风暴,业务中断。

告警信息:

         S9712设备上CPU占用率持续100%,端口占用率持续升高。

解决方案

解决方案:
在S9700交换机的互联端口上配置bpdu bridge enable透传bpdu报文。

解决过程与问题分析:
1. 搭建镜像环境后发现服务器和S9700交换机之间ping不通,交换机上有服务器的arp信息,但是出端口经常变化,通过抓包信息来看服务器的ping-request报文没有达到交换机,说明服务器没有发出ping请求报文;
2. 断开两台S9700之间的连线(4/0/2和4/0/3)后服务器和S9700之间都可以ping通,且可以正常抓取ping报文;
3. 断开服务器和H3C 7502E之间的连线后服务器和两台S9700之间都可以ping通,且可以正常抓取ping报文;
4. 查看二层交换机的MAC学习情况,发现存在服务器的MAC地址同时在7502E上行口学习到的现象;
5. 在所有的交换机互联接口上使能stp,发现stp不能正常收敛,即所有的接口都持续在forwarding状态;
通过以上测试现象可以说明以下几点:
(1) 服务器的双网卡之间可以转发报文:在S9700-2交换机的下行接口收到了S9700-1发出的VRRP协议报文,即该环境中存在物理环路;
(2) 服务器的两个网卡之间不能透传stp报文:交换机上配置stp后不能正常收敛说明stp报文在环中被丢弃;
6. 对交换机下行接口抓取的报文进行分析,发现有源MAC为b8ca-3af9-5da4的stp报文,经过查验该MAC查询是dell设备MAC地址,和现场是dell服务器吻合。因为交换机上配置stp后不能正常收敛,初步分析dell服务器可以单独通过stp报文对两个网卡进行收敛;

7. 因为S9700交换机下行口可以接收到服务器的stp报文,说明S7502E交换机缺省可以透传stp报文,而S9700交换机缺省情况下不能透传stp报文;初步分析问题根因是服务器双网卡之间可以单独通过stp进行收敛,但stp协议报文被交换机丢弃导致不能正常收敛;服务器与交换机之间不能进行stp对接协商。
经过现场验证,在S9700互联接口上配置bpdu bridge enable透传bpdu报文后,环路消除且服务器和交换机之间可以正常ping通,根因确定。

END