OSN 6800设备TOM单板温度过高重启,导致业务时断时续

发布时间:  2016-09-07 浏览次数:  402 下载次数:  0
问题描述
某网络由7台OSN 6800设备组成,配置SNCP保护,某日客户维护人员打电话告知网管上有ODU1_PM_SSF告警,某波业务时断时续,中断几分钟恢复后大约十分钟左右又会中断。
告警信息
网管上上报DOU1_PM_SSF、TEMP_OVER
处理过程
远程登录到客户网管进行问题定位。由于客户网络为SNCP保护,业务中断,问题应该不是出在线路板上,很大可能是出在支路板上。通过分析业务流,找到问题波道的TOM支路板,发现该单板上有上报TEMP_OVER告警,并且出现过多次BD_STATUS的告警,说明该单板在不断的进行重启。由于当时是6月份天气炎热,判断是该单板运行温度过高导致单板重启从而导致业务中断。

从客户那得知,温度过高单板的局点机房空调故障,机房的温度比较高,从而找到了单板温度过高的原因。通过手工设置提高设备风扇的转速,将该单板的温度降了下来,单板未在出现重启的现场,客户的业务也再未出现中断。告知客户业务中断原因,需及时处理机房空调故障的问题,并且对于设备的防尘网也要及时进行清洗,以免堵塞导致散热不好,引起单板温度过高,从而影响业务。
根因
机房空调故障导致机房温度过高,单板散热不好,单板温度上升导致单板不断复位重启,从而引起业务中断。
解决方案
及时修好机房空调,设备防尘网定期进行清洗。
建议与总结
夏季高温时期,要保证机房温度不能过高,设备的防尘网要及时清洗,以免单板运行温度过高,引起业务中断。

END