MPLS TUNNEL出接口配置与实际端口不符造成ARP反复学习影响业务

发布时间:  2011-11-04 浏览次数:  119 下载次数:  0
问题描述
S国PTN较多,组网比较复杂,使用了三层特性,中间有微波以及第三方传输设备。故障定位较为复杂。其中设定POP为汇聚侧PTN,POC为接入侧PTN。在其中一个POP下挂的站点,无线网优投诉指标全面下降。要求故障定位排查。


检查告警信息,发现在POP下挂的站点业务路径所在的TUNNEL反复上报MPLS_TUNNEL_LOCV告警。

处理过程
1.检查告警信息发生的时间和TUNNEL信息。根据设计文档,判断出TUNNEL所承载的MP-GROUP物理链路。
2.因为TUNNEL承载的物理链路中间有第三方传输设备,特别是微波设备,很有可能是因为天气影响造成链路不停闪断。造成TUNNEL一直上报MPLS_TUNNEL_LOCV告警。请求传输工程师配合,最终排除中间物理链路问题,问题重新归结于PTN侧。
3.通过在POC侧的PTN上面的L3VPN端口进行ping测试,发现ping测试的可以通,并且ping包没有丢失,进一步确定了物理链路没有问题。
4.使用TUNNEL ping 功能,发现TUNNEL在ping的过程中间有丢包现象。由此可以初步判定问题可能出现在TUNNEL配置上。
5.在POP侧有ARP MISS,分析出报文在经常这条TUNNEL时,找不到MAC地址,导致发生ARP MISS,这样就造成ARP反复学习。可以判定是ARP反复学习导致的中间TUNNEL闪断。导致TUNNEL不停进行倒换。
6.检查TUNNEL的配置,对照设计表格,没有发现错误。但是在POP侧TUNNEL连接的端口做外环回,在POC侧查看告警,发现对应的是另外一个端口出现LOOP告警,物理连接和实际的设计不符。

根因

检查TUNNEL的配置,对照设计表格,没有发现错误。但是在POP侧TUNNEL连接的端口做外环回,在POC侧查看告警,发现对应的是另外一个端口出现LOOP告警,物理连接和实际的设计不符。

解决方案
1.要求站点工程师下站,按照设计,重新进行光纤的连接。
2.修改TUNNEL的配置,将端口配置在与设计不符的端口上面。

建议与总结
对于TUNNEL LOCV这种告警,可以从上层业务,承载物理链路这样从上到小的定位方法进行定位。一步一步的排除。
ARP MISS 的触发机制也不完善,如果端口是连接错误,TUNNEL不应该可以完成配置。应该提示告警。
关于ARP反复学习影响业务,如果端口配置与实际不符可能会导致业务倒换到备用TUNNEL,但是因为主TUNNEL的ARP学习机制,业务又倒回到主用TUNNEL,然后由于ARP MISS,业务又中断,再次倒回到备用TUNNEL,反复循环。

END