城域网出口IGP路由配置不合理导致IGP、BGP路由震荡

发布时间:  2007-11-26 浏览次数:  100 下载次数:  0
问题描述
组网:
省干A------------------省干B
  |                                     |
  |                                     |
NE5KE(A)-------NE5KE(B)
城域网NE5KE和省干之间是EBGP关系;城域网内部IGP路由为ospf。城域网路由采用BGP中的network发布给省网。
故障现场:NE5KE-A割接之后下挂部分专线客户报障,反映上网非常慢。
处理过程
1、查看设备信息,没有发现任何异常。软件层面和硬件层面fib表项都存在而且正确。
2、查看相关设备的接口信息,没有错包增长,ping测试正常。
3、NE5KE-A上可以正常学习到SR设备下挂的业务网段XXX.YY.24.0/23:该网段是ospf ASE 路由;出接口g2/0/8指向SR设备
<A>dis ip ro XXX.YY.24.0
Routing Table : Public
Summary Count : 1
Destination/Mask    Proto  Pre  Cost       NextHop         Interface
    XXX.YY.24.0/23  O_ASE  70   21         WWW.ZZZ.251.10  GigabitEthernet2/0/8
4、NE5KE-A上通过BGP Network发布城域网的业务网段XXX.YY.24.0/22 给省网,同时配置了22位掩码的黑洞路由:
ip route-static XXX.YY.24.0 255.255.252.0 NULL0 preference 210----此时黑洞路由的优先级为210
ipv4-family unicast
  undo synchronization
  preference 20 80 80
  network XXX.YY.24.0 255.255.252.0-----network发布的网段是22位掩码
5、NE5KE-A、B上在ospf中引入了所有静态路由
ospf 163 router-id y.y.y.y
 default-route-advertise cost 1 type 1
 import-route direct cost 0 type 1
 import-route static type 1-----此时对静态路由没有过滤的引入
 preference ase 70----此时ospf ase路由的优先级为70
6、在NE5KE-A、B上查看22位掩码的业务路由XXX.YY.24.0,发现该路由不稳定一直在振荡,一会儿优选黑洞路由,一会儿优选ospf ase路由,一会儿优选IBGP路由。
根因

故障时XXX.YY.24.0/22优先级配置为:ospf ase引入为70,黑洞路由为210,IBGP引入为80;假设A设备首先黑洞生效为210,引入ospf后并发布给B,B学到该路由,优先级为70。此时B自己的黑洞路由210失效;B的BGP中network通告的是源自A设备发过来的路由条目,通过IBGP通告给A后,A接受IBGP为80的路由。A设备原有210黑洞路由失效,ospf引入的该黑洞路由失效,向B取消该ospf 路由;B收到ospf ase失效后,BGP通告也取消;A设备80的IBGP路由撤销,210路由再次生效;如此往复,导致A、B两出口设备路由不断反复震荡,同时也使得BGP路由不断反复震荡;最终导致业务受影响。

解决方案
1、把黑洞路由优先级调整为50,ospf的ase优先级调整为150,此时业务就已经恢复正常。
2、建议客户在ospf配置中加策略限制引入静态路由的全部引入(过滤了黑洞静态路由的引入)。
      
建议与总结
城域网出口牵涉到的路由协议和策略比较多,已经在全国多次出过类似的问题,大家一定要根据需求情况考虑好各种协议之间的优先级关系和路由策略以及策略路由的使用。

END