因MA5200链路聚合配置问题导致部分用户无法上网

发布时间:  2012-07-26 浏览次数:  155 下载次数:  0
问题描述
版本:MA5200 9310
组网概述:MA5200--S8016--传输--S6506--传输--DSLAM--PC
DSLAM采用小区VLAN方式,PC pppoe拨号。
故障现象:DSLAM下用户有的可以正常上网,有的拨号提示‘远端服务器无应答’,无法上网。无法上网的用户PC机拿到其他地方又可以上网,局方反应在机房打线测试发现同一个端口有的PC可以上网,有的始终不行,提示一样。
处理过程
按以下方法逐步排除:
1。终端原因
    因为同一端口如果有PC可以正常上网,基本排除局端原因。经现场测试,同一端口有的PC可以上网,有的不行,换端口如故,无法上网的PC重装拨号软件、系统,均不行,而拿到其他地方(不同网络)可以正常上网,因此可以排除终端原因;
2。抓包分析:
   抓包发现,无法拨号成功的PC的PADR报文始终得不到应答,有两种可能:PADR报文MA5200没有收到,或者MA5200回的PADS报文没有到达PC,由此确认问题出在DSLAM到MA5200之间;
3。进一步测试:
   将不能上网的PC直接挂在MA5200下可以上网,将PC挂在S8016下仍无法上网,由此确定问题出在MA5200和8016之间,很可能是数据配置问题;
4。检查配置:
   通过检查发现在S8016上的4个FE口配置了链路聚合,但只有两根网线和52相连,而52侧没有配置链路聚合,至此发现是由于链路聚合配置问题导致部分用户无法上网。

处理:连接好网线,MA5200侧配置对应链路聚合,在8016下测试PC可以正常上网,在DSLAM下测试也可以正常上网了,问题解决。
根因
分析:
    根据链路聚合的原理,数据包具体走链路中的哪一条和PC机的网卡MAC地址有关,设备根据hash算法计算结果自动选择走某条链路。对于拨号不成功的PC,因为链路聚合配置问题导致8016送给MA5200的PADR报文从两根网线中的一根到达MA5200,而MA5200对应端口没有加入聚合,丢弃了数据包。之所以PC机可以探测到BAS的存在是因为PADI报文是广播报文,hash计算的结果和PADR(单播)走的路径不同,到达MA5200并为MA5200接收,并回应PADO报文,PC收到后就探测到BAS了。

END