CE12808下挂的Linux服务器重启后ping不通虚拟网关IP

发布时间:  2014-06-28 浏览次数:  986 下载次数:  0
问题描述
两台CE12808组成VRRP主备网关,分别和两台接入交换机互联,每台接入交换机下挂一台虚拟机,将虚拟机1重启后,会发现虚拟机1 ping不通VRRP虚拟网关,20分钟后可以ping通。

告警信息
故障期间存在MAC漂移告警:
hwMflpVlanLoopAlarm_active(l):CID=0x807f0477-alarmID=0x095e0012;MAC flapping detected, VlanId = 315, MacAddress = xxxx-xxxx-1439, Original-Port = Eth-Trunk13, Flapping port = Eth-Trunk23, -. Please check the network to which the interface learning a flapping MAC address is connected.
处理过程

(1)根据MAC漂移日志分析,CE12808正常的下一条出接口在Eth-Trunk13和Eth-Trunk23之间多次漂移,可以确认,在虚拟机1重启后CE128到虚拟机1的下一条出接口漂移,导致ping不通。

(2)20分钟后,CE12808和虚拟机1之间正常ping通后,MAC漂移日志消失,可以确认,20分钟ARP老化后重新学到正确的ARP下一条出接口。

(3)进一步分析发现,在虚拟机1重启期间,虚拟机2的IPv6服务发出了以虚拟机1的MAC地址为源MAC的IPv6组播报文,触发MAC漂移,进而触发MAC联动ARP机制,造成交换机上的ARP表项端口学习错误

根因
(1)根据现场采集MAC漂移日志猜测,在虚拟机1重启后,从CE12808到虚拟机1的下一条出接口漂移到其他端口。

(2)20分钟后可以ping通初步猜测为20分钟ARP老化后重新学习。
建议与总结
(1) 当网络中发生大量MAC漂移时,一般首先排查是否有物理环路,其次要大胆猜想排查是否有其他端口发生了相同源MAC的报文。

(2)  CE12800交换机上的MAC联动ARP机制是为了能在二层网络发生变化时,快速更新ARP表项,但为了防止占用系统资源过多,有了MAC漂移惩罚机制(MAC漂移过多后放弃联动ARP),因此MAC频繁漂移一般表示网络发生了震荡,需要谨慎对待分析。

END