S5700交换机VRRP备往主倒换时ARP表项刷新不及时导致业务中断

发布时间:  2016-04-26 浏览次数:  105 下载次数:  0
问题描述

BSC与UMG主板与Master交换机相连,倒换到与Slave相连的备板上时,速度比较快,Ping网关基本不丢包,网管为两台交换机的虚拟IP地址。当BSC从备板倒回到主板时,无法Ping通网关,等待10分钟左右可以Ping通网关,业务恢复正常。 
 


处理过程

BSC的网关在心跳链路正常时无论怎么倒换,网关一直在Master交换机上。

Bsc主板工作时,在主板工作时,在Master交换机上生成的Arp表项,出接口 Umg ethe0/0/1 ,Bsc,ethe0/0/2,当主板倒换到备板时,由于出接口down ,Arp表项撤销,BSC重新发arp请求网关,,Master响应请求,并生成Arp表项出接口为eth-trunk1,BSC很快完成倒换,备板申请到网关正常工作。

当备板倒回到主板时,eth0./0/2(ethe0/0/1)接口down,Master交换机上Arp 对应主板的表项出接口为eth-trunk1,Arp回应报文沿着eth-trunk1发出,BSC请求网关失败,BSC也无法Ping通网关,一直等待Arp表项老化,时间大约为10分钟左右,BSC发的Arp请求才能得到回应,此时请求网关成功。备板的业务才能倒回主板成功,业务中断10分钟左右。

解决方案

 在Master交换上的配置vrrp的vlanif接口下更改Arp老化时间,改为最小值30秒(默认为1200秒),此时备板倒回主板时,Arp老化时间大大缩短,业务很快切换。有少量丢包。在V100R006及之后版本中可以通过使用mac-address update arp来达到MAC表项与ARP表项快速联动的目的,使设备MAC表项一有变化ARP表项随着一起刷新,缩短流量中断的时间(秒级之内)。

建议与总结

Arp表项老化时间改短后,会增加Arp探测报文的数量,当用户过多时会发送大量的Arp报文,由于交换机cpuArpcar,当Arp报文过多时,会将Arp报文car掉一部分,cpu利用率不会有太大影响。 

END