MA5200G的时钟板故障导致备用主控板反复复位

发布时间:  2012-07-27 浏览次数:  74 下载次数:  0
问题描述
    MA5200G的9号槽位备用主控板反复复位,10号槽位主用主控板正常
告警信息
通过consel采集,发现10号主用主控板报如下告警:
System is busy with warm backup, please wait for a moment...
System is busy with warm backup, please wait for a moment...
Sep 10 2009 00:26:57 YCDT-521-B-MA5200G-01 %%01VFS/3/IPCUNREGDEV_ERR(l): Failed to unregister file system on device 9 through IPC, ipc return value 2.
Sep 10 2009 00:26:58 YCDT-521-B-MA5200G-01 %%01VFS/3/IPCREGDEV_ERR(l): Failed to register device 9 to main file system through IPC, ipc return value is 2.
Sep 10 2009 00:27:11 YCDT-521-B-MA5200G-01 %%01MEM/4/WARNING(l): 
 Just to trace lpu heartbeat
通过9号槽位的CONSEL采集,报如下告警:
Because clock board has occurred exception ,and reset clock board 16.
Sep 10 2009 00:16:44 Quidway %%01SRM/1/LOCKCHANGE(l): Lock mode change to free-run. (CLK=9)
#Sep 10 00:16:45 2009 Quidway SRM/4/CLK_OK:OID 1.3.6.1.4.1.2011.2.17.0.110 CLK 9 hardware fail clear!
#Sep 10 00:16:46 2009 Quidway SRM/0/CLK_FAIL:OID 1.3.6.1.4.1.2011.2.17.0.109 CLK 9 hardware failed!
Sep 10 2009 00:16:48 Quidway %%01SRM/1/LOCKCHANGE(l): Lock mode change to hold. (CLK=9)
#Sep 10 00:17:05 2009 Quidway SRM/0/CLK_FAIL:OID 1.3.6.1.4.1.2011.2.17.0.109 CLK 9 hardware failed!
Sep 10 2009 00:17:06 Quidway %%01SRM/4/RESETCLOCK(l): 
处理过程
    对9号槽位进行更换后问题解决。
根因
   通过告警信息分析,是9号备用主控板的对应的CLK板出现通信异常,可以确定是硬件故障,需要更换
建议与总结
    当时钟板出现故障的时候,我们可以发现备用主控板刚开始是可以注册的,当注册完后跟主用主控板进行同步的时候,由于时钟板故障,导致无法同步,这时候,备用主控板又重新启动。

END