route-id冲突带来的路由刷新导致ospf路由环路

发布时间:  2012-07-26 浏览次数:  196 下载次数:  0
问题描述
组网:
PE1---------PE2
  |                   |
  |                   |
CE1---------CE2
PE和CE之间运行的为ospf多实例,CE为友商B的三层交换机,PE下发ospf缺省路由引导两地业务的互通。PE1和PE2都有另外一个接口连接到同一台UMG设备,并且两台PE上连接UMG的两个接口IP都配置为10.62.128.33,并且绑定到了上面的VPN实例中。正常情况下由于UMG到备用PE2的接口不发光,所以两PE上关于10.62.128.33该接口不会同时UP。
现象:本地CE1和CE2设备ping本地直连PE都正常,但是ping远端其他地市的CE和业务IP会出现偶尔不规则的丢包。
告警信息

处理过程
1、查看设备的路由信息,一切正常。
2、在PE上带源地址为接口地址ping远端业务IP或者远端CE,一切正常。说明承载网正常
3、CE上查看ospf的相关信息,发现两边CE上连的PE设备的route-id都一样为10.62.128.33
sx-s1-a-gdsz-1#show ip ospf nei
----------------------------------------------------------------------------
                                OSPF process: 100
                                 AREA: 0
Neighbor ID     Pri   State            DeadTime   Neighbor Addr   Interface
10.62.128.33    1     FULL/-           4          10.62.128.242   VLAN601
10.62.128.254   1     FULL/-           3          10.62.128.250   VLAN602
----------------------------------------------------------------------------
sx-s1-a-gdsz-2#show ip ospf nei
----------------------------------------------------------------------------
                                OSPF process: 100
                                 AREA: 0
Neighbor ID     Pri   State            DeadTime   Neighbor Addr   Interface
10.62.128.33    1     FULL/-           4          10.62.128.246   VLAN601
10.62.128.253   1     FULL/-           3          10.62.128.249   VLAN602
----------------------------------------------------------------------------
4、在CE1、CE2上不断连续查看缺省路由信息,发现有时候两台设备的缺省路由互指,导致去远端的报文在两CE之间环路。
5、强制指定两边PE上关于该业务ospf多实例的route-id为PE本机上唯一的地址。
PE1:ospf 4 router-id 10.60.2.9 vpn-instance www
PE2:ospf 4 router-id 10.60.2.10 vpn-instance www
6、重启两边PE上该VPN实例的ospf进程,查看ospf邻居关系后,再次进行业务测试一切正常。
      
根因
1、由于两边PE上该VPN实例中绑定的接口中,10.62.128.33该IP地址为最大的一个IP地址。
2、加上开局时ospf多实例的配置为
PE1:ospf 4  vpn-instance www
PE2:ospf 4  vpn-instance www
所以导致PE1、PE2的ospf 进程4都选择10.62.128.33做为route-id
3、CE1、CE2上查看两边PE的route-id都为10.62.128.33
sx-s1-a-gdsz-1#show ip ospf nei
----------------------------------------------------------------------------
                                OSPF process: 100
                                 AREA: 0
Neighbor ID     Pri   State            DeadTime   Neighbor Addr   Interface
10.62.128.33    1     FULL/-           4          10.62.128.242   VLAN601
10.62.128.254   1     FULL/-           3          10.62.128.250   VLAN602
----------------------------------------------------------------------------
sx-s1-a-gdsz-2#show ip ospf nei
----------------------------------------------------------------------------
                                OSPF process: 100
                                 AREA: 0
Neighbor ID     Pri   State            DeadTime   Neighbor Addr   Interface
10.62.128.33    1     FULL/-           4          10.62.128.246   VLAN601
10.62.128.253   1     FULL/-           3          10.62.128.249   VLAN602
----------------------------------------------------------------------------
4、在CE上通过debug ip ospf adj/event相关信息发现,10.62.128.33这设备5秒一次不断发送lsa,而且seq值递增,不稳定。
5、CE交换机均收到同一个routeid两台不同机器发送的lsa,所以show ip route 看到的OSPF缺省路由信息就会不断变动,而当CE-1的缺省路由从CE-2中学到,CE-2的缺省路由又从CE-1中学到时,形成路由环路,就会出现路由不可达信息,造成丢包。
      
建议与总结

END