关于二层环路ME60收到大量padi报文导致cpu高

发布时间:  2011-10-11 浏览次数:  119 下载次数:  0
问题描述

某局ME60下挂的DSLAM的用户上网业务,某日反馈ME60 CPU高达100%,下挂的上线用户由原来的5000降低至3000用户。

该局点ME60的版本为:V6R2C02SPC700+SPC019


组网如下图所示:
ME60-------CX600--------DSLAM





display health
Slot CPU Usage Memory Usage(Used/Total)
10 MPU(Master) 11% 47% 883MB/1845MB
1 BSU 12% 49% 416MB/841MB
3 BSU 14% 49% 417MB/841MB
6 BSU 93% 56% 474MB/840MB
9 MPU(Slave) 6% 24% 450MB/1845MB




处理过程

1、查看设备,发现用户都是从6槽位上送的,查看6槽位的CPU丢包统计,有大量的PPPoE报文上送到CPU,并且hostcar有丢弃计数。

[ME60-1]_d
[ME60-1-diagnose]display cpu-defend statistics-all slot 6-----多次查看,发现有大量的报文丢弃
CarID Index Packet-Info Passed-Packets Dropped-Packets

363 253 PES_EXCP_ID_PPPOE_CTRL 1068941125 262816463
368 225 PES_EXCP_ID_HOST_CAR_TO_CP 65042 541753434
369 258 PES_EXCP_ID_PPPOE_VBAS 1 0


[ME60-1-diagnose]display cpu-defend statistics-all slot 6
CarID Index Packet-Info Passed-Packets Dropped-Packets
363 253 PES_EXCP_ID_PPPOE_CTRL 1069007547 263169574
368 225 PES_EXCP_ID_HOST_CAR_TO_CP 65042 542349336
369 258 PES_EXCP_ID_PPPOE_VBAS 1 0

注意:

PES_EXCP_ID_PPPOE_CTRL-----这个表示丢弃的报文是PPPoE报文
HOST_CAR_TO_CP--------------------这个表示是所有的丢包数字统计

2、查看设备的logbuffer,没有显现异常信息;

3、查看设备的log日志,也就是log.log文件,发现大量的丢包log日志,并且都是丢弃的VLAN 305

Sep 27 2011 18:40:56+05:00 QTA-CNTR-NPE-ME60-1 %%01DEFEND/6/HOSTCARDROPLOG(l)[308677]:Slot=6;Packets were dropped in HOST-CAR. (SlotId=6, CardId=0, PortId=0, UserVlan=305, UserQinQ=NA, UserMac=f4-3e-61-92-5f-78 )
Sep 27 2011 18:40:56+05:00 QTA-CNTR-NPE-ME60-1 %%01DEFEND/6/HOSTCARDROPLOG(l)[308678]:Slot=6;Packets were dropped in HOST-CAR. (SlotId=6, CardId=0, PortId=0, UserVlan=305, UserQinQ=NA, UserMac=00-1e-e3-ed-52-dc )
Sep 27 2011 18:40:59+05:00 QTA-CNTR-NPE-ME60-1 %%01DEFEND/6/HOSTCARDROPLOG(l)[308679]:Slot=6;Packets were dropped in HOST-CAR. (SlotId=6, CardId=0, PortId=0, UserVlan=305, UserQinQ=NA, UserMac=08-18-1a-c5-37-33 )

4、在下挂的CX600上shutdown了该VLAN 305后设备CPU恢复正常,并且所有用户都已上线;

[ME60-1]disp health
Slot CPU Usage Memory Usage(Used/Total)
---------------------------------------------------------
10 MPU(Master) 12% 48% 901MB/1845MB
1 BSU 12% 49% 417MB/841MB
3 BSU 14% 49% 418MB/841MB
6 BSU 41% 57% 484MB/840MB

5、告知客户,查看VLAN 305,并且消除环路源后问题解决。

 

 




根因
因下挂的DSLAM某个vlan有环路,大量的PADI广播报文发送到ME60,ME60收到大量的PADI报文导致CPU忙无法处理部分正常的拨号业务
解决方案

因下挂的DSLAM某个vlan有环路,大量的PADI广播报文发送到ME60,ME60收到大量的PADI报文导致CPU忙无法处理部分正常的拨号业务。规避方法把该VLAN在CX600上shutdow后解决,并且最后找到环路源,消除环路源后问题解决。

建议与总结



END