OceanStor 5600 V3电池故障无告警

发布时间:  2015-08-29 浏览次数:  152 下载次数:  0
问题描述

快钱支付清算信息有限公司(京东)5600V3系统短暂转透写,持续时间2分18秒。

告警信息

处理过程

1、分析事件日志,发现控制器的写cache功能被关闭,数据转透写,2分18秒后恢复回写。



2、5600V3总共2个BBU(1+1冗余),分别插在0号槽位和3号槽位,同一时刻,只要有一个BBU电量充足则认为系统电量充足,分析日志发现系统转透写是因为BBU0正在做放电测试时,BB3也正在充电导致系统备电不足事件转透写。


3、分析驱动BMC(Baseboard management controller,基板管理控制)日志,发现此时系统的确备电不足。

4、继续分析BMC日志,发现在对应的时间点,BBU0启动放电测试时未返回放电测试状态,导致BMC驱动认为其已经放电测试完成,从而启动了下一个BBU3进行放电测试。两个BBU同时进行放电测试导致系统备电不足,之后BBU3发现BBU0正在进行放电测试,停止自身的放电测试,同时进行充电,充电满后系统电量充足,系统转回写。

根因
BMC开启了BBU在线测试后,由于BBU0内部器件异常,放电测试响应慢,未及时返回BBU正在进行放电测试的状态,导致2个BBU同时进行放电测试, 2个BBU同时放电,系统备电不足转透写。
解决方案
更换BBU电池
建议与总结
通过分析日志,发现BBU0未及时响应放电测试,导致BMC同时启动两个BBU做放电测试,系统备电不足转透写。

END