S9300 arp表项错误导致下连虚拟机迁移后业务中断

发布时间:  2015-12-28 浏览次数:  182 下载次数:  0
问题描述
某局点客户反馈在对虚拟机进行迁移后,虚拟机业务会中断10到20分钟,最多中断时间为20分钟后业务自动恢复正常。
告警信息
处理过程

1.根据客户故障情况,初步怀疑问题和arp表项有关,现场还原问题,在问题还原过程中持续观察设备mac地址表和arp表信息。
2.经过观察发现虚拟机相关业务对应ip和mac地址均未发生改变,迁移后虚拟机和设备互联接口从A变成B,mac地址表正常更改接口映射关系,但是arp表对应送出接口未改变,数据依然被发往迁移前的虚拟机互连接口接口。
3.在设备上添加以下命令后问题解决:
system-view
mac-address update arp

根因
交换机mac地址表项和arp表项学习是两个相对独立的过程,mac地址学习可以基于接口收到的任何数据包,而arp表项的学习必须要借助arp数据包的交互,当虚拟机迁移后,新的虚拟机并未发送免费arp来刷新交换机arp表项,而交换机在arp表项存在的情况下默认发送的arp探测报文为为单播arp请求包,迁移后的虚拟机并未收到相应探测报文,而原虚拟机也不会做任何回复,最终只能等待交换机arp表项自行老化后,由交换机触发新一轮的arp学习来实现业务迁移。
解决方案
配置mac表项更新触发arp表项更新功能,当交换机相应mac地址送出接口改变后,触发对应mac地址的arp表项送出接口更新,从而实现业务跟随虚拟机迁移。

END