MA5200G到备用Radius服务器丢包的问题处理

发布时间:  2012-07-26 浏览次数:  151 下载次数:  0
问题描述
组网描述: 用户-MA5200G-本地城域网-省干网络-Radius服务器
1、某地市MA5200G主机ping备用Radius服务器丢包严重,但ping其他地址不丢包。
2、MA5200G对端城域网路由器带连接MA5200G接口的IP地址ping该Radius服务器不丢包。连接在本地城域网下的其他设备如C厂家交换机及Z厂家路由器ping该Radius服务器不丢包。
3、其他地市MA5200G设备ping该备用Radius服务器地址不丢包。
      
告警信息

处理过程
1、登录MA5200G,带源地址(用户网关地址)ping备用Radius服务器丢包严重,在用户PC上ping备用Radius服务器不丢包。
2、打开MA5200G的调试开关,输出MA5200G与Radius服务器交互的icmp报文调试信息,观察MA5200G接收报文的数目。
3、配置流镜像,利用抓包软件捕获MA5200G与Radius服务器交互的icmp报文,分析报文内容。
4、用tracert命令跟踪Radius服务器地址,发现到省干设备C厂家路由器经常有超时现象。
5、配置流镜像,利用抓包软件捕获MA5200G与省干C厂家路由器交互的icmp报文,分析报文内容。
      
根因
1、MA5200G主机带源地址(用户网关地址)ping备用Radius服务器丢包严重,但用户ping备用Radius服务器不丢包,说明MA5200G与城域网路由器之间链路正常,且MA5200G对端路由器接口板FIB转发表项也正常。由于MA5200G路由表只有一条到达城域网路由器的缺省路由,MA5200G主机ping其他地址都不丢包,说明MA5200主控板FIB表项不会有异常。
2、观察ping测试时MA5200G主机icmp的调试报文,发现MA5200G设备底层模块如数收到了Radius服务器的响应报文,但设备CPU丢弃了该报文。从端口流镜像捕获的报文分析可知,MA5200G收到报文的Internet Control Message protocol一项存在校验和错误。在RFC1256的定义里面有一个新的类型,其中对checksum就明确定义了如果checksum不正确就必须丢弃。如果checksum错误,就不能保证其ICMP报文内容的正确性。
3、由于其他地市局点MA5200G设备ping该Radius服务器不丢包,说明Radius服务器发出的报文是正常的,应该是报文在转发路径中某台路由器处理异常。利用tracert命令跟踪发现该地市本地城域网出口C厂家路由器响应常有超时现象,镜像抓包分析证实是该路由器发送给MA5200G的icmp报文存在校验和错误。
      
建议与总结

END