5500 V3 BBU电池误报告警故障排查

发布时间:  2015-08-20 浏览次数:  199 下载次数:  0
问题描述

S5500 V3 BBU电池误告警,拔插后恢复,三个月后有可能再次出现告警。

告警信息

BBU电池亮红灯, The BBU module (Controller Enclosure CTE0, BBU module PSU 0) is faulty with error code (0x0)

处理过程

登录命令行 
admin:/>show upgrade package 
Software Version 

  SN                    Name  IP               Current Version    History Version  Type 
  --------------------  ----  ---------------  -----------------  ---------------  ---------- 
 2102350BSG10EC000018  0A    10.154.71.136  V300R001C10SPC100  --               Controller 
 2102350BSG10EC000018  0B    10.154.71.137  V300R001C10SPC100  --               Controller 
BBU误报为该版本bug需要将版本升级到V300R001C10SPC200

根因

BUCK_PG信号反映电路的电压值是否在正常范围内。如果BUCK的电压环为开环状态,BUCK_PG信号反映出来的电压参数是不准确的。

BBU在线测试时BUCK电路工作在限流环模式,电压环为开环状态,这时BBU软件通过BUCK_PG信号变低来判断BUCK是否正常会产生误告警。

在线测试为每隔三个月进行一次,只有在做在线测试的时候才有可能发生此问题。

BBU1+1冗余,如果一个报故障,另一个不会再做在线测试,也不会再发生此问题,因此不会影响业务可靠性。

解决方案

插拔故障的BBU0:插拔后会触发在线测试流程,还是有概率(0.14%)出现相同的故障告警,不能保证告警一定恢复。

彻底解决,需要升级版本到V300R001C10SPC200

建议与总结

由于V3存储是华为新一代产品,一些版本有bug,提前了解局点信息,交付时将版本升级,防止后续出现问题。

END