CE12808交换机写入明细路由产生丢包

发布时间:  2017-05-03 浏览次数:  242 下载次数:  0
问题描述

客户拓扑如下图所示,核心交换机CE12808与接入交换机CE6800有四条物理链路相连接,4条链路进行链路捆绑,放行业务VLAN,CE6800进行二层透传,业务网关设置在核心交换机CE12808上面。

拓扑中所有业务服务器都在一个网段内,所以在核心路由器CE12808中进行了路由汇总,所有服务器地址汇总为一个大段路由。

ip route-static 192.168.1.0 255.255.255.0  Vlanif192(原有配置)

客户由于业务需求,需要将一个服务器地址以明细路由的形式存在核心交换机CE12808路由表当中,客户在CE12808上写入这么一条静态路由

ip route-static 192.168.1.1 255.255.255.255 Vlanif192


写入这样的静态路由后满足了客户方的需求,但是在测试过程中发现,ping测试该服务器,出现了不规则大量丢包现象。

删除明细静态路由后,再ping测试该服务器地址,无丢包现象。

为什么走明细路由,反而出现丢包?客户方要求解决。

告警信息


处理过程

排查定位问题:
1.汇聚路由情况下,测试无问题,也就是说明线路,设备硬件不存在问题。
2.存在ping通现象,说明路由不存在问题。
最后定位为两个现象可能原因:1.来回路径不一致,可能导致ping丢包。  2.转发机制问题,怀疑设备转发产生问题。
询问客户网络信息,该服务器较为特殊,只有一根物理链路与CE6800相连,不会出现来回路径不一致问题。
最终定位:设备存在转发问题,由于该问题,超出技术方面,采集网络相关信息,交由华为研发分析。

根因

华为研发经过实验室还原最终给出结论:

              根据实验室复现定位确认客户配置静态主机路由指向出接口,丢包的原因是当前为报文查询路由后上送经过软件转发,

              而软件转发性能较差使得ping丢包。


经过实验室测试在当前配置上加上下一跳地址问题即可解决配置如下:

              ip route-static 192.168.1.1 255.255.255.255 Vlanif192  192.168.1.1

客户按照该方法最终解决问题。


解决方案

在解决问题后,与研发沟通了解,报文转发未经过芯片处理,属于软件转发,转发性能差,出现丢包。当前配置上加上下一跳地址问题后该静态路由就上送设备芯片处理,变为硬件转发,就不会出现丢包现象。

最终解释为:该问题不属于硬件故障,可视为CE12800交换机转发机制的bug问题,该问题将会在日后进行完善。

END