因MTU不一致导致OSPF邻居震荡

发布时间:  2016-12-26 浏览次数:  382 下载次数:  0
问题描述

客户网络组网:

某保险公司LJZ分公司两台友商cisco75xx-A系列路由器更换为NE40E系列路由器后,OSPF邻居关系不断UP、DOWN震荡,每几分钟到20多分钟不等就会重复一次。

处理过程

现场收集了NE40E路由器的诊断信息和日志文件,诊断信息经过分析未发现设备异常。但是从日志信息中可以看到

XXX:Neighbor changes event: neighbor status changed. (ProcessId=256, NeighborAddress=10.1.1.1, NeighborEvent=HelloReceived, NeighborPreviousState=Down, NeighborCurrentState=Init) 

XXX:Neighbor changes event: neighbor status changed. (ProcessId=256, NeighborAddress=10.1.1.1, NeighborEvent=2WayReceived, NeighborPreviousState=Init, NeighborCurrentState=2Way) 

XXX:Neighbor changes event: neighbor status changed. (ProcessId=256, NeighborAddress=10.1.1.1, NeighborEvent=AdjOk?, NeighborPreviousState=2Way, NeighborCurrentState=ExStart) 

从日志的信息可以看到,NE40E 路由器的OSPF 邻居关系一直在ExStart/Init和Loading/ExStart间切换,由于客户业务需要恢复,故障环境不存在了,只能搜集了邻居csico 75XX-B路由器日志,信息如下:


Sep 15 00:27:46.086: %OSPF-5-ADJCHG: Process 100, Nbr 10.1.1.2 on Gi7/0/1 from ExStart to DOWN, Neighbor Down: Too many retransmissions
Sep 15 00:28:46.087: %OSPF-5-ADJCHG: Process 100, Nbr 10.1.1.2 on Gi7/0/1 from DOWN to DOWN, Neighbor Down: Ignore timer expired

从上面的日志分析,Cisco 75xx的邻居关系震荡的原因是Too many retransmissions,根据以往的经验,应该和两端的MTU设置不一致有关系。经查证,Cisco 75xx的端口的MTU修改成了是4770字节,而我司的默认MTU是1500字节。双方MTU不一致,我司设备建立MTU时默认不检查MTU,而思科默认检查MTU,从而导致OSPF邻居关系震荡。
在实验室也成功复现了这种情况。实验室中使用NE 和Cisco ASR1002-X通过GE口建立OSPF邻居(Cisco 侧MTU设置为4770)。使用测试仪TestCenter向ASR注入1000条本地路由、50000万条外部路由。过了一会儿,故障复现了, ASR因多次重传导致OSPF 邻居Down。

根因
MTU不一致
解决方案
解决方案
修改两端MTU一致

END