ME60设备修改trunk的MAC地址后私网地址和远端设备业务中断一段时间问题

发布时间:  2014-06-30 浏览次数:  135 下载次数:  0
问题描述
【Problem Summary】网管ping不通ME60下OLT
【Problem Details】

组网: 客户新建一台OLT 公网IP vlanif 2A.A.A.A ;私网IP vlanif 9B.B.B.B  都是作为静态IP分别从ME60 eth-trunk14.1eth-trunk14.3000上线的)

      

       新建OLT设备——裸光纤 ODF——(eth-trunk14.1 & eth-trunk14.3000)  ME60 eth-trunk3.3000——SW——服务器----PCC.C.C.C

 

故障现象:在ME60 eth-trunk14 主接口下一绑定MAC地址,从U2000上就无法pingOLT设备,此时ping网关正常;且从ME60ping OLT设备私网IP和公网IP也正常;

          

          从公网其他ME60ping U2000正常;在eth-trunk主接口下一旦删除MAC配置,从U2000ping OLT设备马上ping通了。一旦添加绑定MAC配置,马上中断ping不通了。

 

          Eth-trunk主接口下绑定MAC地址瞬间,从外网ping OLT公网IP会中断几个包,之后可以恢复。

        

处理过程
步骤一:ME60做ACL统计,确认不通时下游设备没有将流量上送到ME60。

[ME60]display traffic policy  statistics ucl sl 12 inbound  ver rule-based  class  6666

Traffic policy inbound: guanlian

slot 12 :

Traffic policy applied at 2013-11-21 02:46:06

Statistics enabled at 2014-06-26 15:47:04

Statistics last cleared: 2014-06-26 16:41:19

Rule number: 526 IPv4, 0 IPv6

Current status: OK!

 

Classifier: 6666 operator or

if-match ACL 6666

 rule 5 permit icmp source user-group test

    0 bytes, 0 packets

    Last 30 seconds rate 0 pps, 0 bps

rule 10 permit icmp destination user-group test

    0 bytes, 0 packets

    Last 30 seconds rate 0 pps, 0 bps

rule 15 permit icmp source user-group test222

    6,228 bytes, 76 packets

    Last 30 seconds rate 0 pps, 264 bps

rule 20 permit icmp destination user-group test222

    0 bytes, 0 packets

    Last 30 seconds rate 0 pps, 0 bps

步骤二:OLT上行口统计,确认OLT出方向没有回应

 

acl 3100

rule 5 permit icmp source C.C.C.C 0 destination B.B.B.B 0

 rule 10 permit icmp source B.B.B.B 0 destination .C.C.C.C 0

 traffic-statistic inbound ip-group 3100 rule 5 port 0/19/0

traffic-statistic outbound ip-group 3100 rule 10 port 0/19/0

 


 

步骤三:从原理分析,怀疑ME60更新MAC后,OLT的ARP没有及时刷新导致。让现场排查OLT的ARP的学习情况,发现如下差别。

Ping不通时候:


 

Ping通时:

 

 



步骤四:核对这几条ARP的差异,确认这个问题是由于OLT对于C.C.C.C这个IPARP刷新不及时导致的。

对于公私网静态用户,ME6030秒发一次ARP探测,更改接口MAC30秒就可以完成OLT上对于用户网关的MAC刷新。

由于OLT和远端服务器是同一个网段,转发的时候直接学习的是远端网管服务器的MAC地址,导致此C.C.C.CMAC不刷新影响与网管对接。

手动在OLT reset一下ARP业务就可以恢复,具体OLT刷新的时间长短要依赖于OLTARP老化时间。

根因
对于公私网静态用户,ME60会30秒发一次ARP探测,更改接口MAC后30秒就可以完成OLT上对于用户网关的MAC刷新。
由于OLT和远端服务器是同一个网段,转发的时候直接学习的是远端网管服务器的MAC地址,导致此C.C.C.C的MAC不刷新影响与网管对接。
手动在OLT reset一下ARP业务就可以恢复,具体OLT刷新的时间长短要依赖于OLT的ARP老化时间
解决方案
【Resolution Summary】手动触发OLT MAC刷新解决,也可以手动shut/undo shut端口解决。
建议与总结
现网类似修改接口MAC的操作,建议都执行一次端口UP/down操作,主要是触发外部设备感知MAC的变化。
现网尤其是下挂设备和远端设备同网段的场景,接口MAC的更改很容易因为这个私网IP的ARP不能及时感知更新而在一个ARP老化周期内影响业务。

END