交换机部分vlan转发异常导致NE40E BFD报文丢弃问题

发布时间:  2012-12-17 浏览次数:  115 下载次数:  0
问题描述

组网信息:

NE40E作为UMG的网关启用子接口加VRRP加BFD,VRRP心跳和BFD报文均通过S65交换机转发。

客户发现NE40E上不定时会出现一个子接口对应的BFD震荡的日志,其他子接口均没有问题。检查同样组网的其他站点,也没有该问题。
处理过程

1.查看主用路由器的BFD震荡的日志"BFD/4/STACHG_TODWN",发现参数Diagnostic的类型是DetectDown ,说明主用NE40E侧bfd down的原因绝大多数都是BFD会话在检测时间内没有收到对应的BFD报文。

2.查看备用路由器的BFD震荡的日志"BFD/4/STACHG_TODWN",发现参数Diagnostic的类型是NeighborDown ,说明备用NE40E收到了主用NE40E发过来的BFD通知报文。

3.由日志以及现象推测,S65交换机上对这个特定vlan存在单通问题,从主用NE40E到备用NE40E方向不存在丢包,从备用NE40E到主用NE40E方向不存在丢包,

4.联系华3研发检查S65上面的数据,发现两台S65中间互联的聚合口中的一个成员口上有大量未知vlan报文丢弃,怀疑单通与该现象有关。

5.联系客户更换S65互联端口后,问题消失。
根因
BFD报文在中间设备上单向丢弃。
解决方案

更换S65互联端口

建议与总结
NE40E的BFD震荡日志具有一定的参考价值,通过"BFD/4/STACHG_TODWN"的4种down的类型AdminDown、ReceiveAdminDown、DetectDown、NeighborDown可以初步判断出排查方向。

END