NE5000E收不到DD回应报文导致部分LSA重传老化导致CPU冲高

发布时间:  2012-12-21 浏览次数:  120 下载次数:  0
问题描述
版本信息:V300R007C00SPC900
组网概述:NE5000E-----Eudemon
故障现象:CPU使用率比较高,打印大量LSA和OSPF日志问题原因





1、CPU冲高告警
      CPU Usage            : 54% Max: 92%
2、设备答应大量LSA重传和老化告警
  Dec 18 2012 17:08:44 ICRHAA OSPF/2/IFRETX:OID 1.3.6.1.2.1.14.16.2.10 An OSPF packet is retransmitted on a non-virtual interface. (IfIpAddress=10.0.13.58, AddressLessIf=0, NbrIfIpAddress=10.0.13.57, NbrAddressLessIf=0.0.0.0, LsdbAreaId=0.0.0.0, LsdbType=5 LsdbLsid=10.40.4.64, LsdbRouterId=10.0.13.58, RouterId=10.0.13.58, IfNeighbor=10.0.13.61, PacketType=4)
Dec 18 2012 17:08:44 ICRHAA OSPF/2/IFRETX:OID 1.3.6.1.2.1.14.16.2.10 An OSPF packet is retransmitted on a non-virtual interface. (IfIpAddress=10.0.13.58, AddressLessIf=0, NbrIfIpAddress=10.0.13.57, NbrAddressLessIf=0.0.0.0, LsdbAreaId=0.0.0.0, LsdbType=5 LsdbLsid=10.0.196.8, LsdbRouterId=10.0.13.58, RouterId=10.0.13.58, IfNeighbor=10.0.13.61, PacketType=4)




处理过程

1、分析导致CPU冲高的原因
2、查看用户日志和诊断日志发现设备打印大量的LSA重传和老化告警
3、分析可疑路由的详细路由信息和邻居状态
     display ospf peer
     dis ip rou 10.10.70.4 verbose
     dis ip rou 10.203.11.24 verbose
     dis ip rou 10.30.16.30 verbose
     display ospf routing 10.10.70.4
     display ospf routing 10.203.11.24
     display ospf routing 10.30.16.30
4、分析ospf邻居down的原因和时间,同时Ping一下大包,看是否有丢包。
       display ospf 31 peer last-nbr-down
       display ospf 40 peer last-nbr-down
5、分析ospf报文邻居建立的交互过程,分析为什么邻居不能建立成功
6、分析防火墙为什么没有回应NE5000E发出的DD报文

根因

        由于NE5000E上OSPF邻居状态为Exchange,因此在本地路由发生变化时会向邻居发送洪泛报文,并且加重传列表,如果邻居不会ack就会一直重传。而由于防火墙的OSPF邻居一直处于Exstart状态,收到洪泛报文就会被丢弃,因此一直不给NE5000E回复ack报文,因此在5000E上看的情况就是一直的重传一部分LSA。
         同时还有一些已经被老化的LSA由于一直收不到ack,就会一直存在于本地数据库中,时间轮调度一次就打印一次老化告警。最后问题的根因在于防火墙收不到NE5000E的DD报文,排查防火墙配置发现包过滤没有放开。

解决方案
防火墙配置发现包过滤没有放开,放开后问题解决。

建议与总结





END