由于AR配置的BGP抑制dampening配置不当导致RNC业务中断的问题处理

发布时间:  2012-07-27 浏览次数:  139 下载次数:  22
问题描述
某局点3G网络(RNC)的组网如下(见附件),组网规划:CE1与AR1之间采用OptionA接入,CE2与AR2之间也采用OptionA接入;CE1与CE2之间为VPNv4 iBGP邻居关系,通过VPNv4远端交叉私网路由;CE1、CE2之间通过OSPF多实例发布私网路由;CE1、CE2都通过设置静态路由到达RNC1及RNC2,其中两端静态路由优先级设置不一致,根据贝尔RNC业务的需要配置得静态路,分别为210和默认值60;集团在AR1、AR2(AR为贝尔设备)上都配置了BGP dampen功能。
故障现象:CE2与AR2之间的接口down之后,RNC出承载网到SGSN的业务中断,用户无法上网。
告警信息

处理过程
1)业务正常时在CE上通过命令行display ip routing-table vpn-instance 3G_IuPS *** verbose查看IP路由表详细信息;(以下信息为采集的示例)
[ACE2]dis ip ro vpn-instance 3G_IuPS 10.245.111.0 v
此时可以看到IP路由表中存在静态路由和BGP路由两条,不存在OSPF路由。
2)业务正常时,在CE上通过命令行display bgp vpnv4 vpn-instance 3G_IuPS routing-table ***查看BGP路由10.245.111.0/25路由属性详细信息;
[ACE2]dis bgp vpnv4 vpn-instance 3G_IuPS ro 10.245.111.0 255.255.255.128
此时可以看到本地BGP路由表中存在两条路由,一条是引入的静态路由(通过优先级60来确认),另一条是从VPNv4邻居交叉学来的BGP路由。OSPF路由因为在本地路由表中不存在,因此未被引入BGP路由表中。
iBGP邻居CE1发送的VPNv4路由,其实就是CE1引入的OSPF路由。
3)在CE2上通过命令行打开debug开关,观察收发路由详细信息;
4)将CE2和AR2之间的链路shutdown。从debug信息可以看出如下过程:
Shutdown接口后,静态路由撤销,BGP此时优选iBGP路由,所以CE2向AR2的BGP邻居撤销原来发送的静态路由,同时更新iBGP路由。(此时BGP只有从VPNv4邻居交叉下来的iBGP路由这1条路由)。
CE1上的OSPF路由撤销,静态路由活跃,被OSPF引入向CE2发布,所以CE2中的BGP路由表引入并优选OSPF路由,因此CE2向AR2撤销原来发送的iBGP路由,同时更新引入的OSPF路由。(此时BGP存在OSPF路由和iBGP路由这2条路由)。
至此shutdown操作一次,引起路由振荡2次。
在贝尔AR设备上,发现在链路up、down时,BGP的dampening数值越限,因此被抑制。
具体的处理过程请见《处理过程》
最后解决此方法有两种:
1、删除BGP上的dampening设置;
2、重新将CE与AR的BGP重新建立。
                     
根因
1、检查接口数据配置,正确
2、分析静态路有及引入的ospf路有的优先级,业务切换正常
3、检查端口down后CE到RNC能够ping通,同时在CE上检查发布的路有,BGP的PEER正常,存在RNC的业务网段,CE发布的路有没有问题。
4、初步怀疑在AR路由器(贝尔)BGP dampening设置导致此问题
建议与总结
建议在后需的承载网网络中,AR设备不启用BGP dampening设置,确保业务系统的路由在链路质量不稳定的情况下,能够正常通信。

END