园区交换机S9300出现VRRP故障

发布时间:  2014-09-12 浏览次数:  1369 下载次数:  0
问题描述
网络环境
该局点使用S9303作为汇聚交换机,并配置多组VRRP备份组,来达到作为下游用户网关的目的。
现场组网如图1-6所示,使用9303作为汇聚交换机,下行接S9306作为接入,在用户上下班高峰期时会出现VRRP频繁震荡的现象。

告警信息
Jul 13 2013 11:06:25 S9303B %%01VRRP/4/STATEWARNING(l): Virtual Router state MASTER changed to BACKUP, because of priority calculation. (Interface=Vlanif2, VrId=2)
Jul 13 2013 11:06:23 S9303B %%01VRRP/4/STATEWARNING(l): Virtual Router state BACKUP changed to MASTER, because of protocol timer expired. (Interface=Vlanif2, VrId=2)
处理过程
在S9303的VLANIF接口上执行命令vrrp vrid virtual-router-id timer advertise adver-interval 将VRRP通告时间周期调整为3s。问题解决
根因
从次信息中可以看出VID = 2的VRRP备份组出现了震荡,在log中还发现VID为3、4、8的备份组都出现过震荡。
查看现场配置发现在S9303上共配置了10组VRRP备份组,通过display vrrp statistics命令,发现各个VRRP备份组均出现过不同程度的震荡:
<S9303A> display vrrp statistics
  Checksum errors : 0
   Version errors : 0
      Vrid errors : 0  Vlanif2 | virtual router 2
                            Transited to master : 50
                        Received advertisements : 179
                  Advertisement interval errors : 0
                 Failed to authentication check : 0
                         Received ip ttl errors : 0
            Received packets with priority zero : 50
                Sent packets with priority zero : 0
                  Received invalid type packets : 0
        Received unmatched address list packets : 0
            Unknown authentication type packets : 0
                 Mismatched authentication type : 0
                           Packet length errors : 0
       Discarded packets since track admin-vrrp : 0
使用display interface命令检查对应的物理端口,没有发现报文丢弃计数。
观察发现在用户上下班高峰期,端口报文较多,怀疑有较多的协议报文上送,cpu端口报文造成拥塞,cpu无法对VRRP协议报文及时处理,导致震荡。局方使用S9303作为汇聚,S9303是通过接口板直接上送主控板cpu,接口板cpu上有car值,固定为500。
建议与总结

VRRP震荡故障的常见原因主要包括:

传输VRRP通告报文的链路震荡。

通告报文的发送时间间隔过小。

Backup设备接口丢包。


END