华为NE20E-X6与友商Z设备对接OSPF邻居关系不起来

发布时间:  2014-12-25 浏览次数:  212 下载次数:  0
问题描述
1、 故障类型:华为NE20E-X6与友商Z设备业务交换机对接OSPF邻居关系不起来
2、 现象描述:某局点采用华为NE20E-X6路由器与友商Z设备业务交换机对接,华为NE20E-X6作为PE端,友商Z设备业务交换机作为CE端,它们的互联网段宣告在OSPF同一个区域AREA5里面,NE20E-X6分别起子接口与友商Z设备业务交换机互联,但与友商Z设备业务交换机对接的子接口的OSPF邻居关系没有达到FULL。
3、 拓扑图:
 
4, 网络架构描述:某局点采用华为NE20E-X6路由器与友商Z设备业务交换机对接,华为NE20E-X6作为PE端,友商Z设备业务交换机作为CE端,它们的互联网段宣告在OSPF同一个区域AREA5里面,NE20E-X6分别起子接口与友商Z设备业务交换机互联,两台NE20-X6的互联网段则宣告在区域0里面,同时共同在一个AS200自治系统里,建立起IBGP邻居关系,链路上启用MPLS,从而建立MPLS隧道。PE与PE之间的IGP是为了建立BGP连接和交互协议报文,驱动公网标签分配,以建立MPLS隧道。PE与CE之间的IGP是用来传递VPN路由的,并且PE会将这些VPN路由通过BGP发送给对端PE,PE与CE之间的路由采用OSPF,所有的路由都是基于实例,不同的VPN中采用相同类型的路由协议OSPF,最终被Import到MP-BGP中。在整个MPLS核心骨干被看做一个Superbone,PE与CE之间的区域则属于普通骨干或者非骨干区域。
告警信息
处理过程
5, 故障现象介绍:
1, 本端NE20-X6路由器BGP VPN路由表中,无法学习对端NE20-X6路由器的VPN路由。
2, 本端友商Z设备业务交换机VPN业务网段无法Ping通对端友商Z设备业务交换机的VPN业务网段。
根因
6, 原因分析:
1, 排查公网隧道是否存在。
2, 排查本地VPN建立是否符合要求。
3, 排查MP-BGP私网路由传递是否正确。
4, PE与PE端的IBGP邻居关是否正确。
5, PE与CE端OSPF邻居关系是否正确。
6, 线路问题。
解决方案
7, 分析过程:
1, 公网隧道排查,检查公网隧道是否建立起来,检查到对端PE Loopback地址(32位)的公网隧道是否存在,检查公网设备之间的MPLS  LDP邻居关系是否正常,LDP邻居建立完成后,正确的状态应该处于Operational。
2, 本地VPN故障排查,确认本地VPN的设计是否符合用户互访要求,RT,RD的规划是否正确,在PE上查看与对应用户相连的接口状态应该处于UP状态并与对应的VPN实例绑定。
3, 检查PE与PE之间IBGP邻居是否正确,正确的状态是处于Established。

4, 检查PE之间建立起MP-BGP邻居后具备了相互传递私网路由的能力,是否已经将本地的私网路由引入BGP中传递给对端了。
5, 检查PE是否学习到远端用户的私网路由以及本地CE用户的路由信息。

6, 检查PE与CE端的OSPF邻居关系是否建立正确。(卡在了Init状态,FULL才是正常状态)


分析结论:
1, 检查PE与CE端的OSPF邻居关系一直卡在Init状态,未能达到FULL,后与友商配置确认,发现友商Z设备业务交换机上设了OSPF的HELLO时间间隔为1秒以及死亡时间间隔为3秒,而华为P2P类型网络默认出厂HELLO时间间隔为10秒以及死亡时间间隔为40秒。

2, 核对项目方案,为加快邻居建立和路由收敛,运行OSPF的设备接口网络类型统一配置为P2P类型,并且本次部署中,建议调整OSPF Timer数值为:Hello=1s,Dead=3s,并保持全网设备OSPF Timer参数一致。
3, 在PE端的NE20-X6上把OSPF timer数值调整为:Hello=1s,Dead=3s,网络类型为P2P,与CE的OSPF邻居关系能达到FULL。


建议与总结
建议和总结:1,有时OSPF的报文无法正确接收,原因有很多,首先要检查链路层是否畅通。可以打开OSPF的debug开关来查。Debug命令有debugging ospf packet、debugging ospf event等,还可以通过display ospf error来看各种OSPF的错误统计信息。如果OSPF的信息正确,可以通过打开debugging ip packet来检查IP层是否转发成功。
2,项目实施过程中,如涉及到与其他友商设备对接的时候,切记别埋头苦干配置,要及时与友商工程师沟通,如果可能尽量把友商的网络配置拿过来核对,从而能顺利与友商对接起来。

END