介绍全液冷机柜发生故障的处理方法。
主要包含以下几种故障:
故障处理中涉及的部件更换,详细信息请参见部件更换。
液路系统故障
液路系统故障
|
故障现象
|
处理步骤
|
液冷管路系统漏水
|
水压和流量减少
|
- 仔细观察,根据水浸传感器指示查找漏水部位。
- 检查是否为凝露。
- 检查是否为液冷计算节点内部漏水,是否扩展到其他液冷计算节点。
- 检查是否为液冷计算节点侧快速接头漏水。
- 检查是否为全液冷机柜侧管路接头漏水或管路接头漏水。
- 维护人员对漏液部位的管路进行维护处理。
- 凝露:断水断电后,调整机房温度或者调整CDU的温度设置值。
- 液冷计算节点内部漏水:下电液冷计算节点后更换液冷计算节点。
- 液冷计算节点侧快速接头漏水:断水断电后,更换液冷计算节点侧的快速接头。
- 全液冷机柜侧快速接头漏水或管路接头漏水:下电所有机箱等部件,断水并下电机柜,通过集水盘排水管排出系统积水,擦干或吸干剩余积水,擦拭干净水浸传感器上的水,更换机柜。
- 维护完成后再按照液冷系统的安装流程进行安装操作,确保维护的过程中没有杂质引入到液冷系统。
- 检查管路是否还有泄露。
- 确保管路是否没有泄露后上电机柜试运行4个小时以上,检查各个水浸传感器是否正常等。
- 确保CCU没有水浸传感器的告警,正常运行。
|
液冷计算节点出现温度超高报警
|
处理全液冷机柜管道故障
全液冷机柜管道故障
|
故障原因
|
处理步骤
|
液路泄漏(Leak)
|
连接松动
|
- 检查管路螺纹,泄漏点是否被拧紧,如果未被拧紧,拧紧接头或螺纹直到泄露停止。
- 观察机柜连接二次侧补水装置(如水袋)是否满足使用,如发现水量过少,请及时补充,具体参考CDU厂商提供的相关资料。
|
部件破损
|
- 仔细观察,根据水浸传感器指示查找漏水部位。
- 检查是否为凝露。
- 检查是否为液冷计算节点内部漏水,是否扩展到其他液冷计算节点。
- 检查是否为液冷计算节点侧快速接头漏水。
- 检查是否为全液冷机柜侧管路接头漏水或管路接头漏水。
- 维护人员对漏液部位的管路进行维护处理。
- 凝露:断水断电后,调整机房温度或者调整CDU的温度设置值。
- 液冷计算节点内部漏水:下电液冷计算节点后更换液冷计算节点。
- 液冷计算节点侧快速接头漏水:断水断电后,更换液冷计算节点侧的快速接头。
- 全液冷机柜侧快速接头漏水或管路接头漏水:下电所有机箱等部件,断水并下电机柜,通过集水盘排水管排出系统积水,擦干或吸干剩余积水,擦拭干净水浸传感器上的水,更换机柜。
- 维护完成后再按照液冷系统的安装流程进行安装操作,确保维护的过程中没有杂质引入到液冷系统。
- 检查管路是否还有泄露。
- 确保管路是否没有泄露后上电机柜试运行4个小时以上,检查各个水浸传感器是否正常等。
- 确保CCU没有水浸传感器的告警,正常运行。
|
凝露
|
二次侧回路液体温度过低
|
- 排查外部CDU故障,是否存在凝露,如果存在凝露,参考厂商提供的相关CDU手册,可将CDU一次侧管道比例调节阀关闭。
- 排查CDU温湿度传感器是否存在故障。
- 降低机柜内的温度或湿度,直到凝露停止。
- 设备上电情况下,确定凝露是否缓解。
|
电动阀故障
|
电动阀不动作
|
检查以下内容以后再次查看告警。
- 检查电动阀管路线缆是否接好。
- 排查电动阀接线顺序是否正确(CCU的TCU扩展板上+、T、U、-分别对应电动阀的红、白、橙、黑色线),若接线顺序错误,下电CCU,完成接线后再次上电。
- 打开机柜侧门,按下手动按钮,旋转电动阀手柄,观察电动阀手柄是否正常动作,如果能正常动作,考虑电动阀执行器故障,更换电动阀执行器。
- 如果不能正常动作,说明电动阀的阀球被堵塞,需考虑更换电动阀。
|
快速接头故障
|
快速接头不回弹
|
- 如果快速接头在插拔过程中发生不回弹,可将快速头插回连接状态,插拔几次,再次观察快速接头阀芯的状态。
- 如果仍然不回弹,先将快速接头插回原位置,待停机检修时,断水断电更换快速接头。
|
快速接头漏水
|
- 如果快速接头在插拔过程中发生不回弹,可将快速接头插回连接状态,插拔几次,再次观察快速接头阀芯的状态。
- 如果仍然不回弹,先将快速接头插回原位置,待停机检修时,断水断电更换快速接头。
- 如果快速接头回弹,仍发生漏水,考虑快速接头O型圈故障,先将快速接头插回原位置,待停机检修时,断水断电更换快速接头。
|
处理监控故障
LCS告警
|
告警含义
|
处理步骤
|
Leak0 Alarm: Alarm
|
第一路水浸告警
|
- 排查机柜是否漏液,且两个水浸传感器均有告警。
- 如果存在漏液告警,排查水浸传感器黄色线缆是否有水,若有漏液,系统下电,排除漏液故障并擦干水浸传感器,1分钟后再次查看告警。
- 如果仅有一个水浸传感器报警,考虑没有告警的水浸传感器出现故障,需要更换水浸传感器。
- 排除以上故障后,如果告警未消失,则排查水浸传感器。
- 排查水浸传感器POWER灯是否常亮,若未亮,则排查水浸传感器端网线是否正常,是否出现松动或脱落,若异常,则完成接线,1分钟后再次查看告警。
- 排查水浸传感器与CCU上端EEU子卡的ALM_IN端子接线是否正常,是否出现接线松动或脱落,接线顺序是否与线缆标签纸一致,若接线异常,CCU下电,完成接线后,CCU上电,再次查看告警。
- 排查CCU上端EEU子卡是否插稳,若未插稳,则插稳EEU,1分钟后再次查看告警信息。
- 排除以上故障后,如果告警未消失,则下电CCU,更换水浸传感器。
|
Leak1 Alarm: Alarm
|
第二路水浸告警
|
Valve Alarm: Fault
|
电动阀故障告警
|
- 排查电动阀与CCU的TCU扩展板的接线是否正常,是否出现接线松动或脱落,若接线异常,CCU下电,完成接线后,再次上电。
- 排查电动阀接线顺序是否正确(CCU的TCU扩展板上+、T、U、-分别对应电动阀的红、白、橙、黑色线),若接线顺序错误,下电CCU,完成接线后再次上电。
- 排除以上故障后,5分钟以后再次查看告警,如果告警未消失,则下电CCU,更换阀门。
|
Temperature Alarm:Temprature High
|
温度过高告警
|
- 查看机柜入水口水温是否与CDU设定的目标值一致,若不一致,则排查CDU故障。
- 查看高温和低温告警门限,若高温或低温告警门限配置不合理,则修改告警门限。
|
Temperature Alarm:Temprature Low
|
温度过低告警
|
Temperature Alarm:Fault
|
传感器故障告警
|
- 查看温度传感器与CCU的TCU扩展板上的TEM0、TEM1、TEM2端口的接线是否正常、是否出现接线松动或脱落,若接线异常,排除故障后1分钟后再次查看告警。
- 排除以上故障后,告警不消失,则下电CCU,更换3个温度传感器。
|