相邻槽位单板故障导致主备交叉同时上报BUS_ERR告警

发布时间:  2013-05-10 浏览次数:  43 下载次数:  0
问题描述
某局OSN2000设备备用交叉板上报BUS_ERR告警,不影响业务。
网元主控版本:5.50.3.12
交叉板D2XCS版本:1.12
主备交叉板均上报bus_err告警。告警参数是:0x01 0x05 0xff 0xff 0xff。




处理过程

1、业务板故障。
2、业务板物理不在位,但配置了逻辑板的情况下,和另一块正常开工的业务板之间配置了业务。
3、交叉时钟板故障。
4、机框母版故障。





根因

相邻槽位单板故障

解决方案
1、根据告警参数,根据OSN2000的总线编号和板位的对应关系,定位为6槽位业务板和交叉板之间的总线问题,但是客户反馈,6槽位根本没插有单板。
板位号 XCS的总线编号 D2XCS主机总线编号
Slot 4 1~2 1~2,33~34
Slot 5 3~4 3~4,35~36
Slot 6 5~12 5~12
Slot 27 13~16 13~16,37~48,49~64
Slot 28 17~20 17~20,65~76,77~92
Slot 9 21~28 21~28
Slot 10 29~30 29~30,93~94
Slot 11 31~32 31~32,95~96
2、由于OSN2000设备在业务板物理不在位,但配置了逻辑板的情况下,和另一块正常开工的业务板之间配置了业务
时,也会交叉板上报BUS ERR告警。因此怀疑是客户之前6槽位有配业务导致的告警上报。通过:cfg-get-xc:0,0命令进行查询,发现6槽位没有业务残留,排除了这种原因的可能性。
3、由于客户之前为处理BUS ERR告警已经更换过机框和两块交叉板D2XCS,机框和交叉板故障的可能性不大。
4、客户反馈在更换机框,重新插单板时,在5槽位单板插上开工后BUS ERR告警上报,并且硬复位5槽位单板时,BUS ERR告警会消除,等5槽位单板再开工后,又会重新上报。
5、怀疑是5槽位单板问题,干扰了相邻6槽位的总线,导致上报的BUS ERR告警。更换5槽位单板后,BUS ERR告警消失,说明是5槽位单板故障引起的。
建议与总结
1、对于BUS ERR告警,首先可以通过告警参数定位是由哪个槽位的单板总线上报的。
2、当排除配置、交叉板、业务板和机框问题后,总线告警也可能是由其他单板故障干扰导致的。

END