由于NE80E下挂的Eudemon1000未配置nat地址池黑洞路由导致NE80E上行口LDP SESSION频繁UPDOWN

发布时间:  2012-07-27 浏览次数:  120 下载次数:  0
问题描述
组网:NE80E-----Eudemon1000-----SW,Eudemon1000启用nat转换。
版本:NE80E---V300R002C06B511,Eudemon---V200R006C02B066。
故障现象:NE80E上行口LDP SESSION频繁UP/DOWN,ping直连丢包。
                  
告警信息
Oct 16 2009 11:06:10 NM-HH-HCZ-C-1.MAN %%01RNR/3/MPLS_MAXTOKEN(l):-Slot=3; Rainier MPLS load balancing has exceed max number!
 
Oct 16 2009 10:51:15 NM-HH-HCZ-C-1.MAN %%01SOCKET/4/SOCK_CLOSESOCK(l): Current socket was closed, Proto: TCP, Cause: Received RST segment.(是这个导致中断的)
Oct 16 2009 10:51:13 NM-HH-HCZ-C-1.MAN %%01LDP/4/NOFINDSOCK(l): The TCP event 6 was received, but failed to find the corresponding Socket 278.
 Oct 16 2009 11:02:24 NM-HH-HCZ-C-1.MAN %%01RM/3/LDP_SES_STA(l): RM receive LDP session DOWN on the Pos3/0/0.
Oct 16 2009 11:01:48 NM-HH-HCZ-C-1.MAN %%01RM/3/LDP_SES_STA(l): RM receive LDP session UP on the Pos3/0/0.
处理过程
1、查看NE80E设备日志及诊断信息;
2、查看ldp session信息,发送和接收到的keepalive报文数量差别很大。
3、打开debug开关查看NE80E接收到的详细报文信息,发现slot 4收到大量TTL=1的报文。
*Oct 16 15:36:22 2009 NM-HH-HCZ-C-1.MAN IP/7/debug_case:Slot=4;                 
Receiving, interface = GigabitEthernet4/0/9, version = 4, headlen = 20, tos = 0,                                                                             
pktlen = 71, pktid = 44896, offset = 0, ttl = 1, protocol = 17,                 
checksum = 57329, s = 122.4.43.234, d = 219.148.168.209                         
prompt: Receiving IP packet from GigabitEthernet4/0/9 
4、查看下挂的Eudemon数据配置,发现未配置nat地址黑洞路由,添加黑洞路由后故障排除。
根因

建议与总结
NE80E相关配置:ip route-static 219.148.168.208 255.255.255.248 219.148.160.134 preference 60 
Eudemon相关配置: nat address-group 0 219.148.168.209 219.148.168.209
                  ip route-static 0.0.0.0 0.0.0.0 219.148.160.133
外网有攻击,发送大量目的地址为219.148.168.209的数据报文到达Eudemon,由于nat地址池不会生成直连路由,数据报文匹配默认路由被转发至NE80E,在NE80E与Eudemon之间形成路由环路,直到TTL超时,此时NE80E将回应ICMP报文,表示目的地不可达,而发送的目的地址122.4.43.234,出接口为POS3/0/0。由于大量的TTL报文上送,导致在3号板产生了大量的ICMP应答报文,而3号单板本身CPU发包性能就不强,所以必然影响协议报文的发送,最终导致协议震荡,PING丢包。

END