SVN5560双机热备出现双备现象导致业务不可用

发布时间:  2015-08-27 浏览次数:  242 下载次数:  0
问题描述

组网概述:

两台SVN设备采用双机热备方式单臂旁挂部署服务器区,承载在BYOD业务。

故障现象:

当主设备掉电重启后出现双备现象,无法正常提供业务。

处理过程

在主机上执行debug hrp all查看设备debug信息:

1.设备收到的心跳报文信息

*0.98122940 SVN5560-1 HRPI/7/DEBUG:

HRP heart-interface GigabitEthernet0/0/6 receive link-check packet from:2.4.83.140 OK!     //收到心跳报文标识

*0.98123140 SVN5560-1 HRPI/7/DEBUG:

HRP heart-interface GigabitEthernet0/0/6 receive link-check packet from:2.4.83.141 OK!    //收到心跳报文标识

*0.98123240 SVN5560-1 HRPI/7/DEBUG:

GigabitEthernet0/0/6 is DOWN !

*0.98123940 SVN5560-1 HRPI/7/DEBUG:

HRP heart-interface GigabitEthernet0/0/6 receive link-check packet from:2.4.83.140 OK!

*0.98124140 SVN5560-1 HRPI/7/DEBUG:

HRP heart-interface GigabitEthernet0/0/6 receive link-check packet from:2.4.83.141 OK!

 

2. 设备G0/0/1口收到的VRRP报文信息,G0/0/1为设备的业务接口,旁挂在服务区的交换机上。

[DBG:21:0] 2015-04-09 18:10:41[DEBUG][ACL Tracer](DP_L3Fwd_ProcessIpv4:1950)

rcv_if=0x40(GigabitEthernet0/0/1), snd_if=(unknown interface), version=4,

headlen=20, tos=0, pktlen=52, pktid=2745, offset=0, ttl=255,

protocol=112, checksum=31486, s=2.4.83.140, d=224.0.0.18

Prompt: Packet is matched with rules in ACL 3001.[vcpu:21]     //从G0/0/1口收到VRRP报文标识

 

*0.101089750 SVN5560-1 DEBUG/7/PktInfo:

 

[DBG:30:0] 2015-04-09 18:10:41[DEBUG][ACL Tracer](DP_L3Fwd_ProcessIpv4:1950)

rcv_if=0x40(GigabitEthernet0/0/1), snd_if=(unknown interface), version=4,

headlen=20, tos=0, pktlen=52, pktid=0, offset=0, ttl=255,

protocol=112, checksum=34230, s=2.4.83.141, d=224.0.0.18

Prompt: Packet is matched with rules in ACL 3001.[vcpu:30]           //从G0/0/1口收到VRRP报文标识

  

*0.101089750 SVN5560-1 DEBUG/7/PktInfo:

 

[DBG:21:0] 2015-04-09 18:10:41[DEBUG][ACL Tracer](DP_L3Fwd_ProcessIpv4:1950)

rcv_if=0x40(GigabitEthernet0/0/1), snd_if=(unknown interface), version=4,

headlen=20, tos=0, pktlen=52, pktid=0, offset=0, ttl=255,

protocol=112, checksum=34231, s=2.4.83.140, d=224.0.0.18

Prompt: Packet is matched with rules in ACL 3001.[vcpu:21]

 

*0.101089750 SVN5560-1 DEBUG/7/PktInfo:

 

[DBG:30:0] 2015-04-09 18:10:41[DEBUG][ACL Tracer](DP_L3Fwd_ProcessIpv4:1950)

rcv_if=0x40(GigabitEthernet0/0/1), snd_if=(unknown interface), version=4,

headlen=20, tos=0, pktlen=52, pktid=5209, offset=0, ttl=255,

protocol=112, checksum=29021, s=2.4.83.141, d=224.0.0.18

 

Prompt: Packet is matched with rules in ACL 3001.[vcpu:30]

从debug信息中发现设备收到大量的未知设备发送的VRRP心跳报文,地址是2.4.83.140和2.4.83.141,这两组报文影响到双机的正常切换。

经过了解,该局点同时部署了另外一套双机热备的环境,这套环境心跳线未直连,中间跨越交换机,出现双备现象的设备收到的VRRP报文就是从这套双机环境发送过来的,将这套环境中的心跳口shutdown后,双机切换恢复正常。

解决方案

解决方案:

方案一:将设备的心跳线修改为直连方式。

方案二:在交换机上增加vlan,将两套环境隔离开。

建议与总结

1、双机热备中出现双备现象的情况之前从未遇到,一般都是出现双主的现象,遇到这种双备的情况建议先排查设备是否收到未知VRRP心跳报文。

2、双机热备组网中心跳线建议直连。

END