XX局点使用策略路由之后不能自动切换问题

发布时间:  2016-06-21 浏览次数:  204 下载次数:  1
问题描述

XX局点现有一台AR2200作为分部网关设备,与总部上联两条链路,一条为主用链路;一条为备用链路,现网运行ospf路由协议,通过调整ospf cost来规定流量走主用链路。因为客户业务流量较大,所以客户通过策略路由使用备用链路进行传输数据,如果备用断掉之后再切换到主用链路。

现网环境如图:



在正常情况下,客户使用策略路由指导数据转发;流量走向为:分部AR2200-总部设备1-目的网络

当总部设备1侧端口DOWN掉之后,出现分部网络无法访问总部网络。



现象说明:

在分部AR2200上使用策略路由之后,流量走10.1.24.2这边的路线,但是当总部设备1侧链路DOWN之后,分部无法与总部通信。

设备相关配置:

分部AR2200:







故障现象:
正常策略路由转发:

当总部设备1链路DOWN掉之后:


告警信息

业务中断

处理过程

原因分析1:当总部设备1链路down掉之后,无法通信;怀疑是分部AR2200上路由表中没有到达1.1.1.1的路由,所以查看路由表。

根因

原因分析1:当总部设备1链路down掉之后,无法通信;怀疑是分部AR2200上路由表中没有到达1.1.1.1的路由,所以查看路由表。


通过查看路由表,发现存在到达1.1.1.1的路由,但是数据不能通信,因此怀疑在分部AR2200上的策略路由没有失效。

原因分析2:怀疑本地的策略路由没有失效,在询问客户之后得知;设备之间是MSTP链路,当总部设备1侧端口处于DOWN状态,分部AR2200接口依然处于UP状态。所以去验证是不是当分部AR2200接口处于DOWN状态之后,策略路由才会失效。

手动关闭分部AR2200接口,然后测试;测试现象如下:



通过现象可知,手动关闭分部AR2200端口之后,策略路由才会失效。

所以出现此故障的根本原因是分部AR2200检测不到链路断掉,导致策略路由不会失效;所以才会出现分部与总部无法通信。


解决方案

处理思路:因为分部AR2200检测不到链路断掉所以导致策略路由不会失效,那么可以使用BFD技术使其能够检测到链路断掉,从而实现策略路由失效,解决问题。

建立bfd会话使用BFD检测链路状态:

分部AR2200配置:


总部设备1配置:


查看BFD会话是否正常:


模拟总部设备1链路断掉,现象如下:




通过现象可知,当总部设备1侧接口断掉之后,BFD会话也会断掉。这时分部AR2200就能够检测,并且将策略路由失效,查找全局路由表;从而正常转发。

建议与总结

1.特殊网络场景下可以使用多个技术来解决问题。

2.建议设备修改了配置之后及时保存设备配置。

3.根据问题的现象,找出问题的根本原因所在。

END