由于E厂家BAS设备对于LSP确认报文进行抑制导致NE5000E CPU高问题处理

发布时间:  2012-11-22 浏览次数:  47 下载次数:  0
问题描述
某日,某局点发现两台NE5000ECPU利用率升高,到达90%左右,其中路由进程高达45%。
组网如下:

            NE5000E--------NE5000E
                     \                           /
                      \                         /
                       \                      /
                        \                   /
                          \               /
                             SE800









处理过程
对于部分接口的路由协议报文进行跟踪统计,发现部分接口下短时间内就发送了大量ISIS协议报文。


10分钟前
display isis statistics packet interface 
                       PDUs information for GE11/0/38.20
                       ---------------------------------
          Sent packets:
          PDU type                     Total(packets)
          L1 IIH                           0
          L1 LSP                           0
          L1 CSNP                          0
          L1 PSNP                          0
          L1 Unknown                       0
          L2 IIH                     2073650
          L2 LSP                  2392428329      ------NE5000E发送的ISIS LSP
          L2 CSNP                        179
          L2 PSNP                    7640067
          L2 Unknown                       0

          Received packets:
          PDU type                     Total(packets)
          L1 IIH                           0
          L1 LSP                           0
          L1 CSNP                          0
          L1 PSNP                          0
          L1 IIH(error)                    8
          L1 LSP(error)                    0
          L1 CSNP(error)                   0
          L1 PSNP(error)                   0
          L1 Unknown                       0
          L2 IIH                     1812758
          L2 LSP                   512124051
          L2 CSNP                          1
          L2 PSNP                     848668              ------------NE5000E收到的ISIS PSNP
          L2 IIH(error)                    0
          L2 LSP(error)                  421
          L2 CSNP(error)                   6
          L2 PSNP(error)                   0
          L2 Unknown                       0


10分钟后
display isis statistics packet interface 
                      PDUs information for GE11/0/38.20
                       ---------------------------------
          Sent packets:
          PDU type                     Total(packets)
          L1 IIH                           0
          L1 LSP                           0
          L1 CSNP                          0
          L1 PSNP                          0
          L1 Unknown                       0
          L2 IIH                     2073724
          L2 LSP                  2392513367
          L2 CSNP                        179
          L2 PSNP                    7640434
          L2 Unknown                       0

          Received packets:
          PDU type                     Total(packets)
          L1 IIH                           0
          L1 LSP                           0
          L1 CSNP                          0
          L1 PSNP                          0
          L1 IIH(error)                    8
          L1 LSP(error)                    0
          L1 CSNP(error)                   0
          L1 PSNP(error)                   0
          L1 Unknown                       0
          L2 IIH                     1812823
          L2 LSP                   512154314
          L2 CSNP                          1
          L2 PSNP                     848685
          L2 IIH(error)                    0
          L2 LSP(error)                  421
          L2 CSNP(error)                   6
          L2 PSNP(error)                   0
          L2 Unknown                       0



以GE11/0/38.20为例,10分钟内ISIS LSP发送了85038个,但是收到的PSNP确认只有17个。




根因
基本确认,是由于NE5000E大量发送协议报文,导致CPU路由进程负荷过高,最终引起CPU高。

查看出现问题的接口,都是下挂SXXX设备的,怀疑是由于SXXX对于LSP报文进行抑制或者丢弃导致NE5000E大量进行重传。

联系E厂家进行确认,E厂家人员定位后确认SXXX上确实对NE5000E发出的报文进行了错误的抑制,使得NE5000E大量的LSP没有得到PSNP确认,导致NE5000E ISIS报文不断重传(默认值是5秒一次),最终冲高了CPU。

解决方案
E厂商修改配置,加快PSNP的发布速度,NE5000E能够及时收到确认,不再重传报文。




建议与总结

END