XXX某单位视频会议系统 MCU温度告警处理案例

发布时间:  2016-11-18 浏览次数:  211 下载次数:  2
问题描述


接到客户反馈,在XXX视频会议系统开局调测阶段,出现多个局点设备发热,个别出现发热重启现象。
局点:A、B、C等

型号:MCU VP8650

现象:温度告警


整机告警说明

1、8650 整机内部单板正常工作温度范围0~80°(有源器件结温一般为85°、105°等),超过80°,为保护器件,整机会重启;
2、8650 整机内部任一单板温度超出65°,将会持续温度告警,只要温度小于80°以内,告警并不影响设备正常使用,告警提示设备维护人员可能是空调异常或防尘网未清理或环境等原因导致设备温度升高,需维护人员及时维护清理;

处理过程

根据收集的日志分析如下:

1、A局点出现高温告警及高温重启现象

1)5.4~5.7,5.9~10,5.13~5.14,5.16~5.18,5.20,5.24~6.4,6.16~7.9,7.16~7.29,8.1~8.10均有上电记录;

2)6.16号有告警及高温重启,14点开始告警,17点高温重启;

2、B局点出现高温告警及高温重启现象

1)5.12,7.18~8.10号有上电记录

2)7.22号14点出现高温告警【66度】,持续到7.23号2点出现高温重启【80度】,23号有反复高温重启记录;

3、C局点,无高温告警记录(日志被其他告警信息覆盖),无高温重启记录

现场排查分析说明

A市政府温度告警现场排查分析说明

1)安装8650 机柜,机柜门为玻璃门,前门不通风,与业界要求通孔率50%~70% 不符;

2)现场试验,机柜玻璃门关上与打开对8650 整机内部单板温度影响在4~5°左右,测试数据如下,关上玻璃门,单板温度接近告警温度,因不通风,温度逐渐累加将引起告警;



B
市政府温度告警现场排查分析说明
1B市政府机房由普通房间改造而来,非专业机房,具体见附件图片;
2)安装8650 机柜,机柜门为玻璃门,同样存在通风率不够问题,机房不可控,玻璃门存在被人无意关闭的情况;

      
C
市政府温度告警现场排查分析说明
1C市政府机房同样由普通房间改造而来,机房温度由四台立柜空调控制(四个角落,每个角落1台),现场发现只开2台空调,测得8650
所对应机框内周边的温度为27~28°8650 设备所在位置正好对着窗户,8650 设备内部单板普遍要高出3~4°以上,且长期通风不好,长期累加整机温度会上升;

 

根因

最终是由于客户机房环境原因造成:

1、 A市政府机房安装8650机柜玻璃柜门打开后,运行5天(8.11~8.16)正常,无告警;

2、 B市政府机房安装8650机柜玻璃柜门打开并清除告警后,运行5天(8.12~8.17)正常,无告警;

3、C市政府,8650告警清除后,再打开一个空调后,运行4天(8.12~8.16)正常,无告警,但因机房环境温度较高,整机单板温度相对A市政府和B市政府高3度左右;

 

附照片:

B市政府机房环境


 C市政府机房环境


 D市政府机房环境






解决方案

针对现有机房不满足系统技术关于A、B类机房要求(机柜散热孔率低、空调温控不确定性因素、灰尘、开窗等因素),同时基于现有机房无法改造,且甘肃湿度普遍比较低,解决措施为适配现有机房环境,防尘网规格由70PPI替换为50PPI;

在A市政府以及D市政府(机房在地库,机房内堆积杂物,甚至放自行车,空调为柜式空调,实际机柜温度为27~28°,机房内区域温度差异大,具体见附件图片)更换新防尘网后,整机单板温度明显下降,温度在现有基础下降6~7°,温度余量完全可满足要求现有机房环境;



建议与总结

长期机房环境温度改善建议


机房温度控制范围:23℃±1℃


长期设备积尘改善建议


1、 非标准机房,避免打开窗户;
2、 定期清理防尘网(1个月清理一次


各级电子信息系统机房技术要求

END