E1业务与友商对接出现编码违例导致业务中断问题处理

发布时间:  2016-07-30 浏览次数:  198 下载次数:  0
问题描述

如图所示:一条E1业务从D点经C、B传到A点落地,其中C、D为我司设备,A、B为Z厂商设备,B、C站点之间通过E1电口对接,某天用户发现该业务频繁不可用,断断续续,因为该业务为重要生产业务,用户启用备用电路,暂时不使用该故障电路。用户对故障电路进行了长时间定位,无法查清原因,希望我司共同定位。

图1 电路路由示意图

告警信息
我司设备上无任何告警和性能信息。通道正常。
处理过程

一、告警分析法

   检查我司线路和单板误码性能,发现全部正常;友商检查线路和单板性能,称也正常。

二、利用二分法进行故障定位

   D点内环回环向A点,A点挂表误码严重;

   C点PL1板软件外环环向A点,挂表发现误码严重;

   B点EPE1板内环环向A点,挂表发现无误码;

   问题定位到BC之间。

三、在B站DDF硬件环回环向A站,无误码。

四、此时初步怀疑故障范围可能是B站与C站DDF之间的细缆、C站DDF至C站PL1之间问题,用户称两机房DDF间有3条E1都出现该问题,并且近期机房无施工挤压线缆的情况发生,且线长不超标,故排除线缆问题。

五、用户将C站PL1软件外环向DDF,该机房DDF挂表测试8小时,无误码。结合前面的判断,问题并不在我司设备。

六、重点怀疑为BC两设备间对接问题,可能原因为接地、阻抗、负载、干扰、时钟以及设备缺陷。

七、询问用户,得知两台设备在相邻机房,但两个机房的地排并不共地,故障原因极有可能是两边机房不共地造成的。

八、与用户一起查看友商设备网管,检查其支路单板性能,发现在BC之间DDF电缆放通时,B站点E1端口上报“编码违例事件”,而在B站点DDF架硬件自环环向B网元时,“编码违例事件”消失,更加确认了可能为不共地原因造成本次故障,如图2所示。

图2  编码违例事件

 

九、让用户用粗铜线将两个机房间地排连接起来,C站软件环回A站,A站挂表,无误码;D站环回A站,无误码,友商编码违例事件消失,问题处理结束。

图3 编码违例事件消失

 

根因
两个机房间设备不共地。
解决方案
将两个机房的地排连接起来后,故障消失。
建议与总结

一、E1对接的场景,在确认了彼此设备都正常但是问题仍然存在的情况下,需要重点怀疑设备接地是否良好、设备间是否共地。

二、在与友商对接场景下,由于对方网管的告警、性能可能并不完全被我方掌握,但是底层原理是相通的,在征得用户同意下,如果对友商设备有一定的熟悉,可以与用户再一起检查一下友商网管,可能能够发现协助快速解决问题的线索。

三、我司的老SDH设备,由于硬件限制,对PDH信号的监测能力非常有限,只能检测T_ALOS/E1_AIS等简单的告警,对编码违例事件无检测能力。我司设备自OSN1500/2500/3500/7500起,大部分支路板已经支持检测,详细如下表所示。

支持上报E1_LCV_SDH上报的单板情况如下:

产品

支持上报E1_LCV_SDH性能上报的单板

OSN2500/OSN3500/OSN7500/OSN7500II

SSN2PQ1SSN1PQM

OSN1500

SSR2PD1SSN2PQ1SSN1PQM

OSN2000/Metro3000

Metro1000

42FP2D/45FP2D

     

                                     

 

 

 

 

 

 

四、掌握编码违例含义,对处理故障能起到事半功倍的效果。下面再就编码违例作详细说明。

 

   1、E1接口编码违例原因:

      a、支路板自身的接口部分性能不好。

      b、在拔插接口电缆的瞬间,支路端口会产生轻微的CV计数。

      c、电缆的焊接或压接质量不良。

      d、若几乎所有的支路都上报CV,原因可能是交换设备、传输设备没有共地。

      e、电缆质量不好。

      f、业务码型选择错误。

      g、设备附近有强烈干扰源。

      h、工作环境温度超出设备可以容忍的正常温度。

   2、 编码违例对业务的影响

      a、CV值比较小,15分钟内有几个或没有,24小时内零星上报,对业务不会有影响。

      b、CV15分钟内较大,且是持续的增加,业务可能受影响,出现话音噪声或数据乱码,严重时可导致业务中断。

      c、突发式出现的很大的CV值,会导致业务瞬间中断。

   3、处理

      d、按可能导致的原因逐个检查,建议按由易到难顺序检查。

END