路由环路引发CPU使用率高的故障分析一例

发布时间:  2012-12-14 浏览次数:  153 下载次数:  0
问题描述
网速慢,接口流量比平时大。
告警信息
无。
处理过程
查看接口流量,发现一些接口流量较大,同时CPU使用率也较高。
<USG50>disp cpu 
===== Current CPU usage info ===== 
CPU Usage Stat. Cycle: 20 (Second) 
CPU Usage            : 63%
CPU Usage Stat. Time : 2000-04-02  19:54:06 
CPU Usage Stat. Tick : 0x117(CPU Tick High) 0x6fb7258e(CPU Tick Low) 
Actual Stat. Cycle   : 0x0(CPU Tick High) 0x143e6d83(CPU Tick Low)
 
19:54:07  04-02-2000


查看IP统计信息发现有大量TTL溢出报文。

<USG50>disp ip stat 
  Input:   sum                  1421      local                     0  
           bad protocol            0      bad format                0 
           bad checksum            0      bad options               0 
           TTL exceeded       144241   
  Output:  forwarding              0      local                  1442 
           dropped                 0      no route                  0 
  Fragment:input                   0      output                    0 
           dropped                 0    
           fragmented              0      couldn't fragment         0  
  Reassembling:sum                 0      timeouts                  0 
  ReassemMBufErrs:                 0 
03:08:22  04-02-2000 
<USG50>  

查看接口IP统计信息,发现有大量的无效TTL报文。
<USG50>  disp ip interface ethe0/0/1
Ethernet0/0/1 current state : UP
Line protocol current state : UP
The Maximum Transmit Unit : 1500 bytes      
ip fast-forwarding mode is QFF        
ip fast-forwarding outgoing packets is Enable
ip fast-forwarding on the same-interface is Disable
input packets : 14238, bytes : 1195355, multicasts : 0 
output packets : 14160, bytes : 792960, multicasts : 0
ARP packet input number:           2 
  Request packet:                  0   
  Reply packet:                    2  
  Unknown packet:                  0   
Internet Address is 100.1.1.1/24  
Broadcast address : 100.1.1.255 
TTL invalid packet number:    144260
ICMP packet input number:          0
  Echo reply:                      0
  Unreachable:                     0
  Source quench:                   0
  Routing redirect:                0
  Echo request:                    0 
  Router advert:                   0 
  Router solicit:                  0 
  Time exceed:                     0 
  IP header bad:                   0  
  Timestamp request:               0 
  Timestamp reply:                 0 
  Information request:             0 
  Information reply:               0 
  Netmask request:                 0  
  Netmask reply:                   0 
  Unknown type:                    0  
DHCP packet deal mode:  global   

通过以上信息判断应该是存在路由环路,导致流量异常,报文缺省TTL一般为255,当出现环路时,一个报文会经过255跳直到TTL 值减为0才会被丢弃,因此这部分流量会被放大,影响正常流量转发。
3层环路一般较难判断准确的环路位置,需要结合tracert来分析环路的路径,然后逐跳检查设备路由,最常见的是缺省路由配置不当导致部分目的地址的报文产生环路。
根因
网速慢的原因一般多为流量大导致链路拥塞、网路设备转发延时增大、链路上丢包增加导致重传、服务器超载等,而流量大有可能是正常的访问量大、存在网络攻击、会网络环路产生的异常流量等。
建议与总结
路由环路问题多是配置不当产生的,良好的配置规范是避免路由环路的有效方法。

END