AR3200 配置NQA检测的主链路中断导致路由震荡网络丢包

发布时间:  2016-12-30 浏览次数:  139 下载次数:  0
问题描述

组网:

 

AR3200上路由配置

 

AR3200双出口,配置NQA与静态路由联动,联动的线路运营商侧网络中断(网络架构中传输设备和AR2之间线路中断),

路由震荡,网络丢包。

告警信息

路由器出现默认路由下一跳在两个出口间来回切换

处理过程

查看AR3200路由器直连的接口,并没有UP/down不稳定现象。并且有路由震荡的日志,而主路由是和NQA联动的,先排查NQA问题。

debugging NQA查看是否NQA检查结果有问题。

<Huawei>
Dec 24 2016 20:47:20.575.5-08:00 Huawei NQA/7/debug:
FileNo:LineNo 00:16394 , Type: icmp AdminName: aa TestName: bb ICMP test is succ
ess to finish.

<Huawei>
Dec 24 2016 20:47:20.575.6-08:00 Huawei NQA/7/debug:
FileNo:LineNo 00:16394 , Type: icmp AdminName: aa TestName: bb Success to create
 one history records.

<Huawei>
Dec 24 2016 20:47:20.575.7-08:00 Huawei NQA/7/debug:
FileNo:LineNo 00:02680 NQA aa bb has notified the module 3490840576 the status i
s from DOWN to UP.

<Huawei>
Dec 24 2016 20:47:28.525.3-08:00 Huawei NQA/7/debug:
FileNo:LineNo 00:16394 , Type: icmp AdminName: aa TestName: bb Icmp test is time
out.

<Huawei>
Dec 24 2016 20:47:28.525.4-08:00 Huawei NQA/7/debug:
FileNo:LineNo 00:16394 , Type: icmp AdminName: aa TestName: bb Success to create
 one history records.

<Huawei>
Dec 24 2016 20:47:28.525.5-08:00 Huawei NQA/7/debug:
FileNo:LineNo 00:02680 NQA aa bb has notified the module 3490840576 the status i
s from UP to DOWN.

2、从debugging信息中得知,NQA检查一会成功一会失败,分析原因,由于主路由和NQA联动,如果NQA检查目的地址走的主路由,而主链路和NQA检查目的地址中间的链路中断,会导致主路由中断,这是所有数据走下一跳为3.3.3.2的默认路由,网络正常。而默认路由下一跳变为3.3.3.2后,NQA的目的地址仍然可以通过这条默认路由到达,于是NQA检查又会成功,主路由又生效,此时默认路由的下一跳变为1.1.1.2,网络不通。

根因

NQA检查的目的IP可以通过与NQA联动的路由和没有与NQA联动的路由到达,导致和NQA联动的主路由中断的时候出现路由震荡。

解决方案

 

将NQA检查的出接口指定为与NQA联动的路由下一跳对应的出接口(此例中为G0/0/0)。

 

指定NQA检查的出接口,问题解决,网络无丢包。

建议与总结

NQA与路由联动配置根据实际情况,建议指定NQA检查的出接口。

END