由于S93 vsi底层表项没被删除导致友商设备发生MAC漂移

发布时间:  2014-09-12 浏览次数:  180 下载次数:  10
问题描述
S9300(版本为V1R2SPC002)与友商设备通过trunk互联,S93的trunk接口下绑定了VSI,在友商上发生MAC漂移,漂移MAC为0025-9e14-0b87,在友商设备上漂移到的两个接口为LAG3(互联S93的trunk5)和sdp681,正常情况下应该保持从sdp681学来这个MAC地址,而且从友商设备上采集的mac表项来看漂移的频率比较高,但是在互联的S93上没有发现MAC漂移,一致保持在从eth-trunk5学来这个MAC地址。(拓扑见附件)
告警信息

处理过程
1.友商设备发生MAC漂移的两个接口见附件拓扑标注;
2.经过确认,友商设备上正确的表项应该在右边的接口学来;
3.左边的接口通过trunk与S93互联,在S93上观察MAC表项,发现对这个目的MAC地址一直保持从与友商设备互联的trunk口(eth-trunk5)上学来。
<VAL-AG-S9306-001>dis mac-add 0025-9e14-0b87
MAC address table of slot 1:
-------------------------------------------------------------------------------
MAC Address    VLAN/       PEVLAN CEVLAN Port            Type      LSP/        
               VSI/SI                                              MAC-Tunnel  
-------------------------------------------------------------------------------
0025-9e14-0b87 NCR-AN-OM   -      -      Eth-Trunk5      dynamic   1/0         
0025-9e14-0b87 RRPP-NCR-03 -      -      Eth-Trunk5      dynamic   1/0 
MAC address table of slot 2:
-------------------------------------------------------------------------------
MAC Address    VLAN/       PEVLAN CEVLAN Port            Type      LSP/        
               VSI/SI                                              MAC-Tunnel  
-------------------------------------------------------------------------------
0025-9e14-0b87 NCR-AN-OM   -      -      Eth-Trunk5      dynamic   2/0         
0025-9e14-0b87 RRPP-NCR-03 -      -      Eth-Trunk5      dynamic   2/0         
-------------------------------------------------------------------------------
MAC address table of slot 6:
-------------------------------------------------------------------------------
MAC Address    VLAN/       PEVLAN CEVLAN Port            Type      LSP/        
               VSI/SI                                              MAC-Tunnel  
-------------------------------------------------------------------------------
0025-9e14-0b87 NCR-AN-OM   -      -      Eth-Trunk5      dynamic   6/0         
0025-9e14-0b87 RRPP-NCR-03 -      -      Eth-Trunk5      dynamic   6/0         
-------------------------------------------------------------------------------
interface Vlanif2203
 description RRPP-NCR-03
 l2 binding vsi RRPP-NCR-03
4.MAC表项是靠流来触发和维持的,友商对目的MAC地址从左边的接口学来,说明有流量从S93到友商设备,而S93的MAC表项保持不漂移,因此怀疑流量从友商设备到了S93之后,S93又返回了一份给友商设备;
5.经过研发定位:这个问题是一个时序问题。 触发条件是undo int eth-trunk. 删除trunk时我们会通知删除相关vsi表项,有一定的概率出现删除vsi表项之前trunk就被
删除掉了,导致部分vsi表项删除失败.所以流量到了S93之后又返回一份给友商设备。
操作记录日志:
Dec  8 2010 03:37:50 XXXXX%%01SHELL/6/DISPLAY_CMDRECORD(l): Record command information. (Task=co0, Ip=**, User=huawei, Command="display this")
Dec  8 2010 03:38:00 XXXXX%%01SHELL/5/CMDRECORD(l): Record command information. (Task=co0, Ip=**, User=huawei, Command="undo eth-trunk 5")
#Dec  8 03:38:00 2010 XXXXX/IFNET/4/IF_PVCDOWN:OID 1.3.6.1.6.3.1.1.5.3 Interface 124 turned into DOWN state.
根因
MAC表项是靠流来触发和维持的,友商对目的MAC地址从左边的接口学来,说明有流量从S93到友商设备,而S93的MAC表项保持不漂移,而且是从与友商互联的接口上学来,因此怀疑流量从友商设备到了S93之后,S93又返回了一份给友商设备。
建议与总结
规避方案:在删除eth-trunk之前先删除eth-trunk所在的vlanif上vsi的相关配置,然后再删除eth-trunk.
恢复方案: 整机重启. 
彻底解决方案:由于硬件限制V1R2版本无法通过补丁解决这个问题;需要在V1R3SPC200后才能解决这个问题。

END