S9706设备出现VRRP双主导致业务中断

发布时间:  2014-10-25 浏览次数:  302 下载次数:  9
问题描述
两台设备版本:S9700-V200R001C00SPC300+V200R001SPH015
现象:客户割接S8505为友商高端交换机S10000系列后下挂接入交换机业务中断,查看VRRP状态均显示为Master.
S9706主备模式,且S8505和主备S9706接口的是不同pvid的access接口,vrrp心跳组播报文无法从S8505侧通过
组网如图所示:
告警信息
Trapbuffer中看到:706_BAK %%01VRRP/4/STATEWARNINGEXTEND(l)[39]:Virtual Router state BACKUP changed to MASTER, because of protocol timer expired. (Interface=Vlanif7, VrId=7, InetType=IPv4)
处理过程
1. VRRP主备设备上的配置参数不对称,如验证类型(包括类型和验证字)、备份组ID、虚地址列表、版本等,这个排除割接前正常割接后出现问题。
2. 心跳报文所经过的链路不通或不稳定,排除,心跳报文双链路且链路都确定没有问题。
3. CPU使用率过高,经查CPU利用率正常,排除。
4. 端口被STP、RRPP等破环协议错误阻断,查看端口STP状态,为discarding。原客户S8505和S9706使用GE互联,割接后为10GE,端口开销变小,导致将心跳报文链路2GE端口阻塞,变为双主导致业务中断,修改心跳链路开销后业务恢复正常。

解决方案
[Eth-Trunk1]stp cost  2000 
建议与总结
路径开销是STP/RSTP协议用于选择链路的参考值,不同速率的端口路径开销缺省值不同,当我们启用防环协议的时候需要考虑端口路径开销值。

END