PTN3900由于漏配路由trace VRRP状态导致VRRP切换后无线2G业务不通

发布时间:  2012-03-30 浏览次数:  98 下载次数:  12
问题描述
XX局点移动承载网络采用我司PTN产品组网,POC为PTN1900或PTN3900,POP均为PTN3900,产品版本为V100R002C02,应用产品新特性IP over PW。无线基站搬迁时有一个2G站点业务不通。














处理过程
如拓扑图所示,IP LINE方案POP侧到RNC、BSC的保护采用VRRP保护,VRRP跟POC与POP之间的PW冗余保护不作联动,每连接一个RNC或BSC起一个VRRP保护组。以BSC为例,假定原来POP1的VRRP为主,在POP1的VRF配置两条到BSC的路由,分别是路由B和路由C,它们的目的地址相同。路由C的下一跳出接口为直连接口A,优先级为1;路由B的下一跳出接口为POP间的LAG口,优先级为200。其中优先级为1的路由C要配置trace BSC的VRRP状态,同理POP2的配置与POP1相似。正常情况下POP1把路由C下发到FIB转发表,POP2把优先级为200的路由下发到FIB转发表,当VRRP状态切换,POP1和POP2都会把另外一条路由下发到FIB转发表,保证业务不断。但如果没有配置路由C trace VRRP的话,设备不会有这个动作,报文继续从端口A转发,而POP1的VRRP状态处于初始化状态,报文得不到正确处理,业务会不通。






根因
IP LINE方案POP侧到RNC、BSC的保护采用VRRP保护,VRRP跟POC与POP之间的PW冗余保护不作联动,每连接一个RNC或BSC起一个VRRP保护组。以BSC为例,假定原来POP1的VRRP为主,在POP1的VRF配置两条到BSC的路由,分别是路由B和路由C,它们的目的地址相同。路由C的下一跳出接口为直连接口A,优先级为1;路由B的下一跳出接口为POP间的LAG口,优先级为200。其中优先级为1的路由C要配置trace BSC的VRRP状态,同理POP2的配置与POP1相似。正常情况下POP1把路由C下发到FIB转发表,POP2把优先级为200的路由下发到FIB转发表,当VRRP状态切换,POP1和POP2都会把另外一条路由下发到FIB转发表,保证业务不断。但如果没有配置路由C trace VRRP的话,设备不会有这个动作,报文继续从端口A转发,而POP1的VRRP状态处于初始化状态,报文得不到正确处理,业务会不通。 

解决方案

1、检查POC和POP1的2G路由,都已经配置,IP LINE业务能ping通;
2、检查BSC的VRRP状态,发现已经切到POP2上,在POP2上检查2G路由也已经配置;
3、查看PW状态,发现工作PW在POP1上,保护PW在POP2上,就是说上行PW报文是在POP1终结,但根据VRRP状态回程报文是在POP2入PW;
4、检查POP1的FIB转发表,下发到FIB表的路由为路由C,根据VRRP状态下发到FIB表的路由应该是路由B;
5、检查路由C,原来这条路由没有配置trace VRRP状态,所以VRRP状态切换后没有把路由B下发到FIB表;
6、修改路由C trace BSC的VRRP,故障解决。








建议与总结
1、检查POC和POP1的2G路由,都已经配置,IP LINE业务能ping通;
2、检查BSC的VRRP状态,发现已经切到POP2上,在POP2上检查2G路由也已经配置;
3、查看PW状态,发现工作PW在POP1上,保护PW在POP2上,就是说上行PW报文是在POP1终结,但根据VRRP状态回程报文是在POP2入PW;
4、检查POP1的FIB转发表,下发到FIB表的路由为路由C,根据VRRP状态下发到FIB表的路由应该是路由B;
5、检查路由C,原来这条路由没有配置trace VRRP状态,所以VRRP状态切换后没有把路由B下发到FIB表;
6、修改路由C trace BSC的VRRP,故障解决。





END