数通产品NE20E-S8经过传输OSN3500与NE40E-X3eth-trunk对接,lacp模式不能对接成功

发布时间:  2016-05-25 浏览次数:  127 下载次数:  0
问题描述


NE40E-X3版本:V600R001C00SPC800
NE20E-S8版本:V800R007C10SPC100


OSN3500通过分2块布在不同槽位上的N3EGS2板卡的1端口与NE20E-S8和NE40E-X3互连。

NE20E-S8与NE40E-X3中间通过传输0SN3500对接,做以太网端口的链路聚合,采用默认手工负载分担模式。传输中间链路中断,而设备侧互连传输端口up的情况发生时,eth-trunk的默认手工负载分担方式不能检测到链路故障仍然照常发送数据,会导致经过故障链路的数据中断(手工负载分担模式只能根据本端端口的up/down来判断链路的通断来做出转发调整。eth-trunk默认采用逐流的负载分担模式,经过哈希算法得出出接口后后续该流报文会一直通过此接口转发)。

为避免这种情况发生,需要将现网手工负载分担的工作模式改为带链路检测的静态lacp的工作模式,通过lacp检测报文及时发现链路故障,从而自动做出调整。

将两端设备eth-trunk工作模式更改为静态lacp模式,erh-trunk接口下:mode lacp-static;并将两端lacp报文发送时间修改为fast模式:erh-trunk接口下: lacp timeout fast(默认间隔10秒,修改后为1秒

修改配置后,两端设备通信中断,eth-trunk接口不能up

处理过程

在更改两端设备互连eth-trunk接口工作模式为lacp模式后两端设备不能通信无法ping通。
在两端设备上查看eth-trunk接口状态: display interface eth-trunk 1,显示两个个成员接口的状态为:down
查看两端设备成员物理接口的实际状态:display interface 物理接口均为up 
在两端设备上查看eth-trunk接口详细信息:display eth-trunk 1 verbose, 活跃链路状态两个成员接口均为:unslected
在两端设备上查看lacp报文收发情况:display lacp statistics eth-trunk ,发现两端都是只有发报文(LacpSentPdu)而收报文(LacpRevPdu)数量为0;



根据以上情况怀疑是中间传输通道存在问题,联系华为数通400并建立关联单到传输设备400一块进行分析。经过过分析得知在数据设备之间通过链路捆绑进过传输互连时,传输设备侧端口也需要进行链路捆绑配置才能对接成功。当时传输侧并未进行链路聚合配置,导致lacp报文被丢弃。
经过对传输设备型号OSN3500和使用板卡N3EGS2的进一步分析,发现该板卡:1.不支持跨板链路聚合2.只支持手工负载分担模式的链路聚合不支持静态lacp模式。导致该模式修改不能进行,随后将配置倒回,设备通信正常业务恢复。

根因

传输侧设备没有进行链路聚合配置,并且不支持跨板链路聚合和静态lacp模式链路聚合

导致lacp报文经过传输设备时被丢弃,从而两端路由器不能收到对端发送的lacp配置报文,不能协商成功,认为链路故障将eth-trunk端口down掉。

对于为默认手工负载分担模式时,传输侧的链路聚合配置则为非必需。因为这种模式下中间链路只需提供通道即可不存早配置协商协议的发送和支持故不配置链路聚合通信仍然正常。此时只是传输侧本身链路没有链路聚合的保护。

解决方案

后期更改互联eth-trunk端口为pos口,hdlc协议自带链路层协议检测功能而不必过分依赖于传输设备。

建议与总结

在链路聚合通过传输设备进行对接时,一定要考虑将eth-trunk工作模式修改为静态LACP模式,或者通过自带协议检测的pos端口进行互连

在链路聚合通过传输设备进行对接时,一定要考虑传输侧设备对链路聚合的支持情况,以免发生不支持导致不能进行对接。

在链路聚合通过传输设备进行对接时或其他情况下不单单涉及到本专业设备时,修改数据配置时需要将所有设备的支持情况考虑进去,不能只关注本专业设备。

END