S5700的GVRP参数设置不合理导致丢包

发布时间:  2014-09-12 浏览次数:  351 下载次数:  0
问题描述
1、问题涉及的设备及版本:
S9300 S9300V100R006C00SPC800、S5700 S5300V100R005C01SPC100
2、组网概述:

3、问题描述:
1)不同楼层之间用户使用QQ传输大容量文件时存在中断问题,相同楼层之间用户进行传输则不会中断。
2)有线用户之间使用QQ传输大容量文件不会有问题,但WIFI用户有问题,一定是WIFI质量不好?
4、关键配置信息:
<3F-OfficeNet-01>disp current-configuration 
#
!Software Version V100R005C01SPC100
sysname 3F-OfficeNet-01
#
info-center loghost 10.0.64.147
#
vlan batch 2 to 255
<3F-OfficeNet-01>disp current-configuration  int Eth-Trunk  0
#
interface Eth-Trunk0
description to S9306 's eth-trunk 30
port link-type trunk
port trunk allow-pass vlan 2 to 4094
stp loop-protection
traffic-policy stat inbound
traffic-policy stat outbound
ntdp enable
ndp enable
gvrp
bpdu enable
dhcp snooping trusted
#
告警信息
1、设备无任何alarm或log或trap信息
2、debug信息里面有GVRP的异常信息
<3F-OfficeNet-01>debugging  gvrp  info 
<3F-OfficeNet-01>t d
Info: Current terminal debugging is on.
<3F-OfficeNet-01>t m
Info: Current terminal monitor is on.
GARP_GidRcvLeaveall! ulIfIndex - 61
Jul 15 2013 17:19:52.810.6 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GARP_GidHandleLeaveall! ulifindex-61
ulTxLeaveAll-0,isJoinRun-0,isHoldRun-0,LeaveTimer-0,isLeaveRun-0
Jul 15 2013 17:19:52.810.7 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GARP_GidLeaveall! ulIfIndex - 61,usLastGidUsed - 349
Jul 15 2013 17:19:52.810.8 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GARP_StartTimer : ulIfIndex-61,ulTimeOut-200,enType-0
Jul 15 2013 17:19:52.810.9 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GARP_StartTimer : ulIfIndex-61,ulTimeOut-150,enType-1
Jul 15 2013 17:19:52.810.10 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GARP_StartTimer : ulIfIndex-61,ulTimeOut-13977,enType-3
Jul 15 2013 17:19:52.810.11 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GARP_GipPropagateLeaveAll! ulIfIndex - 61
Jul 15 2013 17:19:52.810.12 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GARP_GidHandleLeaveall! ulifindex-62
ulTxLeaveAll-1,isJoinRun-0,isHoldRun-0,LeaveTimer-0,isLeaveRun-0
Jul 15 2013 17:19:52.810.13 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GARP_GidLeaveall! ulIfIndex - 62,usLastGidUsed - 349
Jul 15 2013 17:19:52.810.14 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GVRP_TransmitPkt : ulIfIndex-62,ulLength-60,enAppType-1,usVlanTagId-1
GARP_StartTimer : ulIfIndex-62,ulTimeOut-200,enType-0
Jul 15 2013 17:19:52.810.20 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GARP_StartTimer : ulIfIndex-62,ulTimeOut-150,enType-1
Jul 15 2013 17:19:52.810.1 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GARP_GidHandleLeaveall! ulifindex-57
ulTxLeaveAll-1,isJoinRun-0,isHoldRun-0,LeaveTimer-0,isLeaveRun-0
Jul 15 2013 17:19:52.810.2 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GARP_GidLeaveall! ulIfIndex - 57,usLastGidUsed - 349
Jul 15 2013 17:19:52.810.3 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GVRP_TransmitPkt : ulIfIndex-57,ulLength-60,enAppType-1,usVlanTagId-1
GARP_StartTimer : ulIfIndex-57,ulTimeOut-200,enType-0
Jul 15 2013 17:19:52.810.9 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GARP_GidHandleLeaveall! ulifindex-58
ulTxLeaveAll-1,isJoinRun-0,isHoldRun-0,LeaveTimer-0,isLeaveRun-0
Jul 15 2013 17:19:52.810.10 3F-OfficeNet-01 GVRP/7/GVRP DBG_Message :
GARP_GidLeaveall! ulIfIndex - 58,usLastGidUsed - 349
处理过程
1、现场解决措施:
将WIFI业务使用的VLAN在S57上创建,问题得到彻底解决。反复测试几次后未再出现问题,ping也不丢包,故障消失。
#
vlan batch 2 to 350
根因
1、对于WIFI终端跨楼层QQ传文件丢包问题,分析如下:
1)通过分别在三楼和四楼接入交换机端口做镜像抓包,分析QQ传文件中断前连续超过10秒的四楼的重传报文无法发送到3楼,初步判断传文件中断是由于交换机网络丢包导致。
2) 通过在交换机网络中逐段抓包,逐段排查确认故障时报文丢在S57交换机上。
3)查看该S57交换机上对应的mac表项,发现故障时部分mac地址查询不到:
[3F-OfficeNet-01]disp mac-address 68a3-c477-e908
MAC address table of slot 0:
-------------------------------------------------------------------------------
MAC Address    VLAN/       PEVLAN CEVLAN Port            Type      LSP/LSR-ID 
               VSI/SI                                              MAC-Tunnel 
-------------------------------------------------------------------------------
68a3-c477-e908 326         -      -      Eth-Trunk6      dynamic   -          
-------------------------------------------------------------------------------
Total matching items on slot 0 displayed = 1
4) 查看对应的vlan表发现故障期间端口从vlan中退出,导致转发不通,当端口加入vlan后,业务恢复。该vlan是GVRP学习的动态vlan,此时GVRP状态不稳定。
<3F-OfficeNet-01>disp vlan 326   //vlan端口不正常,业务出现中断
* : management-vlan
---------------------
VLAN ID Type         Status   MAC Learning Broadcast/Multicast/Unicast Property
--------------------------------------------------------------------------------
326     dynamic      enable   enable       forward   forward   forward default 
----------------
Tagged     Port: Eth-Trunk0                 
----------------
Interface                   Physical
Eth-Trunk0                  UP      
<3F-OfficeNet-01>disp vlan 326
Error: The VLAN does not exist.
<3F-OfficeNet-01>
<3F-OfficeNet-01>disp vlan 326
* : management-vlan
---------------------
VLAN ID Type         Status   MAC Learning Broadcast/Multicast/Unicast Property
--------------------------------------------------------------------------------
326     dynamic      enable   enable       forward   forward   forward default 
----------------
Tagged     Port: Eth-Trunk6                 
----------------
Interface                   Physical
Eth-Trunk6                  UP                 
<3F-OfficeNet-01>disp vlan 326
* : management-vlan
---------------------
VLAN ID Type         Status   MAC Learning Broadcast/Multicast/Unicast Property
--------------------------------------------------------------------------------
326     dynamic      enable   enable       forward   forward   forward default 
----------------
Tagged     Port: Eth-Trunk6                 
----------------
Interface                   Physical
Eth-Trunk6                  UP     
<3F-OfficeNet-01>disp vlan 326    //vlan恢复正常,业务恢复
* : management-vlan
---------------------
VLAN ID Type         Status   MAC Learning Broadcast/Multicast/Unicast Property
--------------------------------------------------------------------------------
326     dynamic      enable   enable       forward   forward   forward default 
----------------
Tagged     Port: Eth-Trunk0                  Eth-Trunk6                          
----------------
Interface                   Physical
Eth-Trunk0                  UP     
Eth-Trunk6                  UP     
5)通过将对应的vlan配置成静态vlan后,重新测试,反复测试几次后未再出现问题,ping也不丢包,故障消失,确认故障就是此原因导致。
结论:QQ传文件中断是因为S57上GVRP学习到的动态vlan不稳定,S57上下行端口eth-trunk0和eth-trunk6频繁的加入退出vlan导致业务不通,当业务不通的时间超过10秒时,QQ传文件会出现中断。
2、对于有线终端传QQ文件不中断不丢包问题
1)通过核实有线终端使用的255之前的vlan,在设备上属于静态配置;但WIFI业务使用的是256及之后vlan属于GVRP学习,所以有线终端不会有这类问题,并非是wifi质量问题。
建议与总结
1、能不使用GVRP的场景下,建议采用静态VLAN。
2、如果需要使用GVRP场景,注意参数的设置。
garp timer命令用来设置接口的GARP定时器(包括Hold定时器、Join定时器、Leave定时器)的值。
undo garp timer命令用来恢复接口的GARP定时器(包括Hold定时器、Join定时器、Leave定时器)的值为缺省值。
缺省情况下,默认参数Hold定时器的值为10厘秒,Join定时器的值为20厘秒,Leave定时器的值为60厘秒。
但在实际组网中,建议用户将GVRP定时器配置为以下的推荐值:
GARP Hold定时器:100厘秒(1秒钟)
GARP Join定时器:600厘秒(6秒钟)
GARP Leave定时器:3000厘秒(30秒钟)
GARP LeaveAll定时器:12000厘秒(2分钟)
命令garp timer { hold | join | leave } timer-value


END