No relevant resource is found in the selected language.

This site uses cookies. By continuing to browse the site you are agreeing to our use of cookies. Read our privacy policy>

Reminder

To have a better experience, please upgrade your IE browser.

upgrade

Inappropriate PAF cause Slow Route Convergence

Publication Date:  2012-07-27 Views:  27 Downloads:  0
Issue Description
1. Please refer to the attachment for network topology.
2. Router A is configured with a static route to network 30.30.30.0/24 pointing to router C while Router B is configured with a static route to the same network pointing to Router D. Each static route is tracking BFD session to next hop.
3. Router A establish OSPF adjacency with Router B while Router C establish OSPF adjacency with Router D.
4. Router A and C will advertise interface connected to test gear. All router will import static route.
5. Traffic generated from test gear from interface with IP address of 40.40.40.2/24 to subnet 30.30.30.0/24. Traffic can be received normally.
6. Unplug the link between router A and C.
7. Traffic is break down for 10s before convergence.
BFD session is down immediately (30ms) after the interface shutdown, static route is removed, backup route via Router B is active but traffic only convergence after 10sec.
Alarm Information
Null
Handling Process
1. Verify FIB table and lower layer table during normal situation.
[NE40E-X16-1-hidecmd]display fib 30.30.30.2
  Route Entry Count: 1
Destination/Mask   Nexthop         Flag TimeStamp     Interface       TunnelID
30.30.30.0/30      192.168.71.2    GSU   t[2932368]    GE1/1/0         0x0
[NE40E-X16-1-hidecmd]
[NE40E-X16-1-hidecmd]display pe-entry 1 1 fibv4 30.30.30.2 0
20 00 0F 0F 0F 01 00 00  00     --------------------------------- KEY-TCAM
TID_FIB_L = 1 VRID = 0 IPv4 = 30.30.30.2
#Index: 419 (0x1a3)
#DdrNum=1, Address:0x1a3
1D 00 00 08 18 15 08 E0  40 00 40 00 00 00 00 00       ---------- RE-DRAM
All below number is decimal.
is_default_route = 0
Opcode = 7(NHIP) Ag = 0 EnTTLDec = 1
QppbAction = 0 ( No QPPB Param ) 
OportInfo = 64(tb=0x1,tp=0x0)
NHIP = 192.168.71.2 ORIF = 2 ATinv = 0
OVID = 0 IsVlanif = 0
2.  Verify FIB table and lower layer table after unplug the link between router A and C. FIB table showing that next hop is updated to 172.16.220.222 but lower layer table still didn't updated.
[NE40E-X16-1-hidecmd]display fib 30.30.30.2
  Route Entry Count: 1
Destination/Mask   Nexthop         Flag TimeStamp     Interface       TunnelID
30.30.30.0/30      172.16.220.222  DGU   t[2932442]    GE1/0/0         0x0
[NE40E-X16-1-hidecmd]display pe-entry 1 1 fibv4 30.30.30.2 0
20 00 0F 0F 0F 01 00 00  00     --------------------------------- KEY-TCAM
TID_FIB_L = 1 VRID = 0 IPv4 = 30.30.30.2
#Index: 419 (0x1a3)
#DdrNum=1, Address:0x1a3
1D 00 00 08 18 15 08 E0  40 00 40 00 00 00 00 00       ---------- RE-DRAM
All below number is decimal.
is_default_route = 0
Opcode = 7(NHIP) Ag = 0 EnTTLDec = 1
QppbAction = 0 ( No QPPB Param ) 
OportInfo = 64(tb=0x1,tp=0x0)
NHIP = 192.168.71.2 ORIF = 2 ATinv = 0
OVID = 0 IsVlanif = 0
3. Noticed that big number of ARP-MISS packet (10223).
[91-hidecmd]dis pe-c 1 1 cause  verbose
Cause 0X13 =                1H(CAUSE_DROP_L2_DISABLE)
Cause 0X33 =                8H(CAUSE_CPU_DIPV4_224)
Cause 0X52 =                4H(CAUSE_DROP_LRNONLY)
Cause 0X5D =            1FEA3H(CAUSE_DROP_ECAR_RED)
Cause 0X64 =             27EFH(CAUSE_CPU_ARP_MISS) 
Cause 0X76 =                4H(CAUSE_DROP_MAIB_INVALID)
Cause 0X89 =                1H(CAUSE_CPU_ROUTE_PROTOCOL)
Cause 0XD6 =               C8H(CAUSE_CPU_HEARTBEAT_PKT)     
4. Found that the router is using 128K ARP PAF file which is not general PAF file.
5. Revert to the general PAF file which is supporting only 64k ARP.
6. Redo the test and convergence time is below 1 second with BFD.
Root Cause
Traffic didn't switch to another route after preferred route (static route) is removed. This indicated that the problem is related to the routing convergence.
Suggestions
Previously 128K ARP PAF is archieved by using extension where 64K store at TCAM while 64K at DRAM. Search capability of DRAM is slower compare to TCAM. Thus if the ARP record store at DRAM, it will occupied long CPU cycles and causing the route didn't refresh at lower layer table after routing convergence.
By default the PAF is only storing 64k ARP. In case of any special PAF or license, HQ should be consulted to understand the potential risk and problem.

END