NE40E因VRRP心跳问题导致MASTER上配置了延时抢占未生效

发布时间:  2010-04-28 浏览次数:  112 下载次数:  2
问题描述
组网:见附件图示1。2台NE40E千兆电口下挂一台友商BSC,对其启用VRRP协议。
      NE40-A为主用,且配置了抢占延时120秒。VRRP心跳走下面BSC的交换网板。
版本:与版本无关。
故障现象:在一次网络故障后发现NE40E-A从备用重新抢占为主用的时间为4秒,远小于120秒。日志如下:
Feb 23 2010 17:39:02 NE40E-A %%01VRRP/4/STATEWARNING(l): Interface: Vlanif1182, Virtual Router 10 : BACKUP changed to MASTER!
Feb 23 2010 17:38:58 NE40E-A %%01VRRP/4/STATEWARNING(l): Interface: Vlanif1182, Virtual Router 10 : INITIALIZE changed to BACKUP!
Feb 23 2010 17:38:58 NE40E-A %%01IFNET/4/LINK_STATE(l): Line protocol on interface Vlanif1182 has turned into UP state.
Feb 23 2010 17:38:58 NE40E-A %%01IFNET/4/IF_STATE(l): Interface Vlanif1182 has turned into UP state.
Feb 23 2010 17:38:58 NE40E-A %%01PHY/4/STATUS2UP(l):-Slot=6; GigabitEthernet6/0/9: change status to up.


处理过程
1、配置问题;
2、链路问题;
3、友商设备问题;
4、其他问题。
根因

由于心跳报文通过的链路出现故障,导致了出现双主VRRP

解决方案
1、检查配置无问题;
2、查询NE40E-B的日志发现:当NE40E-A的下行后DOWN后,NE40E-B立即抢占为主用。
当NE40E-A的下行后端口UP后,NE40E-A立即抢占为了主用,而NE40-B却没有倒换到BACKUP状态。从而出现了“双主”的情况。说明心跳链路某处中断。
   建议客户排查友商BSC的交换网和网线后业务恢复。倒换测试后VRRP抢占延时也正常。
建议与总结
1、VRRP的抢占延时配置生效是在SLAVE收到MASTER发送的hello报文后才能生效的。若心跳中断则延时配置无效,立即抢占为主;
2、建议VRRP心跳上移到NE40E互联链路上,一方面避免电口的不稳定导致双主的出现,另一方面NE40E互联为跨板捆绑,安全性更好。见附件图示2。

END