由于自身PPP处理机制问题导致某厂家路由器在MA5200F下频繁掉线

发布时间:  2012-07-26 浏览次数:  106 下载次数:  0
问题描述
组网:8016--MA5200F--L2--网吧J厂家路由器--PC,J厂家路由器采用内置PPPOE拨号方式连入MA5200F,做NAT为下挂PC提供上网业务。
故障现象:MA5200F下挂的J厂家路由器出现频繁掉线的故障,平均10秒钟左右就可以在MA5200上面看到一次上下线的记录。
告警信息

处理过程

1、在MA5200F上使用display aaa offline-record查看用户的下线原因均为ppp user request,判断用户下线是因为用户主动请求。
2、在MA5200F上使用业务跟踪(trace)功能,查看用户上下线的过程发现,用户在认证成功后6秒钟左右发出了termianal request报文请求拆链,导致用户下线。而此时也没有到用户握手失败探测的时间,所以不是因为PPP握手失败导致用户下线。
3、配合路由器查找原因,了解路由器判断链路是否正常是根据发送的DNS请求是否有响应而不是使用PPP ECHO报文,并且发送DNS请求报文的源端口为53。
4、通过抓包可以发现,在路由器做为用户PPP拔号上线后,发送的DNS请求的确没有收到响应,通过逐断抓包确认路由器发送的DNS请求在上行的S8016上被丢弃。
5、在S8016去掉过滤相关报文的策略后,路由器拔号上线正常。

根因
该路由器判断链路可用的根据不是PPP链路的维持报文而是靠拨号成功后发送的DNS请求报文是否有回应,这种做法不符合协议标准,而且由于发出的DNS报文源端口也是53,导致省公司在流量监测中误认为城域网内有人私自设置DNS服务器而在城域网的出口S8016上对进入城域网的目的端口是53的报文进行了相应过滤设置,导致该款路由器发出的DNS请求被丢弃(普通用户的DNS源端口不会是53),得到不响应,所以路由器认为PPP链路中断而重新拔号,业务异常。
建议与总结

END