由于网线梯形水晶头导致NE40E与MSOFTX3000产品对接丢包问题

发布时间:  2008-12-29 浏览次数:  107 下载次数:  1
问题描述
某G9软交换局点于12月10日升级路由器,从NE40升级为NE40E。出现IFM板与NE40E的EFGE电口以太口对接时严重丢包,ping包丢包率达86%。


处理过程
现场测试:
1、由于NE40E设备外出端口为GE电口,出现该问题后,对两端网口工作模式检查,均为自协商模式,协商成100M全双工方式,Link状态正常。对两端网口设置成强制100M全双工方式,出现的故障仍然不能恢复,Link也状态正常。说明问题不是端口协商不上导致。
2、将NE40E设备和PC机直连,然后在PC机PING NE40E设备,发现可以PING通,不存在丢包现象。PC机可以PING通NE40E设备,说明NE40E的收发报文正常,并且对于PING报文的处理正常。
3、针对旧网线对接NE40E设备长度不够的现状,进行过在MSOFTX3000侧端口不变,在NE40E侧通过转接头增加延长线的方式测试,可以PING通。
说明NE40E设备通过旧网线和MSOFTX3000设备连接没有问题。
4、经过对多块BFI单板的更换和测试,多个批次和生产时间的BFI单板同NE40E直接对接时均出现该问题(包括08年8月的单板),由此确认该问题跟BFI单板的生产时间和批次没有直接联系。在BFI板和NE40E设备之间增加LSW后,不再出现底层错包和ping包丢包,后台也不再出现SCTP告警,BFI能够正常接收到对端发送过来的报文。后直接将NE40E设备断开回退到NE40设备与BFI单板对接,同样不出现SCTP告警。
说明这是MSOFTX3000设备、连接网线及NE40E设备之间的配合问题。
5、对新旧网线的编码进行检查,发现旧网线和新网线编码不一致。新网线的编码为19-04070012-0218260830,旧网线的编码为19-04040101-0217480750V4。说明问题很有可能是由于网线的类型不同而导致的。
6、将实验室正常运行的BFI板与NE40E设备对接(使用从现场带回的新网线),更换NE40E的不同端口进行PING测试,可以PING通。
7、将带回的前方已确认配合有问题的BFI板与NE40E设备对接(使用从现场带回的新网线),更换NE40E的不同端口进行PING测试,可以PING通。
说明并非所有的NE40E设备和MSOFTX3000设备通过新网线连接均会出现该问题。
8、NE40E设备和MSOFTX3000设备通过交换机S3526E连接(使用从现场带回的新网线),在NE40E设备上PING MSOFTX3000设备,可以PING通。
通过上述测试,更加确定该问题很有可能是由于网线类型的差异导致的,经过和线缆专家的确认,发现从现场带回的网线水晶头类型为梯形水晶头。使用梯形水晶头曾经出现过问题,公司工艺部门专门成立过攻关组定位过该类问题。
根因

定位结论如下:
梯形水晶头最窄处为438um和最宽处为743um。而正常水晶头屏蔽水晶头绝缘隔片开槽端面呈矩形,宽度为640um。经过测量发现所有厂家的插座接触件的宽度一般都为450um左右,都大于438um,所以若插座接触件接触到438um的位置的绝缘将会影响水晶头和插座接触件的接触经过以上分析,可以得出结论,NE40E与MSOFTX3000产品对接丢包问题原因为网线水晶头本身存在隐患,加之单板之间存在差异,造成个别单板和水晶头无法良好接触,从而出现该问题。

解决方案
通过更换软交换BFI单板或者对接网线都可以解决该问题。
建议与总结
通过此问题的发现,公司已经明确后续发货的网线水晶头禁止采用梯形头,因而从根本上杜绝了此类问题的发生。

END