前言
概述
本文档针对服务器iBMC的各类告警,从告警含义、对系统的影响、可能的原因、解决的步骤等方面进行详细的介绍。
读者对象
本文档主要适用于以下人员:
- 技术支持工程师
- 维护工程师
符号约定
在本文中可能出现下列标志,它们所代表的含义如下。
符号 |
说明 |
---|---|
表示如不避免则将会导致死亡或严重伤害的具有高等级风险的危害。 |
|
表示如不避免则可能导致死亡或严重伤害的具有中等级风险的危害。 |
|
表示如不避免则可能导致轻微或中度伤害的具有低等级风险的危害。 |
|
用于传递设备或环境安全警示信息。如不避免则可能会导致设备损坏、数据丢失、设备性能降低或其它不可预知的结果。 “须知”不涉及人身伤害。 |
|
对正文中重点信息的补充说明。 “说明”不是安全警示信息,不涉及人身、设备及环境伤害信息。 |
修订记录
修改记录累积了每次文档更新的说明。最新版本的文档包含以前所有文档版本的更新内容。
文档版本 |
发布日期 |
修改说明 |
---|---|---|
48 |
2023-02-15 |
增加支持2288X V5(VC)机架服务器。 |
47 |
2022-09-13 |
|
46 |
2022-07-15 |
|
45 |
2022-03-02 |
新增了0x100000B7。 |
44 |
2021-11-24 |
更新了0x1A00000D。 |
43 |
2021-08-30 |
|
42 |
2021-08-02 |
|
41 |
2021-07-05 |
更新了ALM-0x29000017 网卡光模块的功率异常(Port,严重告警)、ALM-0x1000000D 主板RTC电池电压低(Mainboard,严重告警)、ALM-0x0100001F CPU下挂内存VDDQ1电压读取失败(Memory,轻微告警)和ALM-0x01000021 CPU下挂内存VDDQ2电压读取失败(Memory,轻微告警)。 |
40 |
2021-06-07 |
新增以下告警: |
39 |
2021-04-21 |
更新了ALM-0x1A000019 与其它iBMC心跳异常(BMC,严重告警)、ALM-0x2C00004B 内存配置错误(System,紧急告警)、ALM-0x2C00002B 上电超时(System,严重告警)和故障部件模式事件类告警。 |
38 |
2021-03-17 |
更新了前言。 |
37 |
2021-02-25 |
更新了ALM-0x06000005 RAID扣卡故障(RAID Card,严重告警)、ALM-0x06000007 RAID扣卡MCE/AER错误(RAID Card,紧急告警)、ALM-0x06000025 RAID扣卡控制器通信丢失(RAID Card,严重告警)和ALM-0x06000027 RAID扣卡控制器初始化异常(RAID Card,严重告警)。 |
36 |
2021-02-05 |
新增以下告警: |
35 |
2021-01-08 |
更新了故障部件模式事件类告警故障码处理。 |
34 |
2020-12-31 |
|
33 |
2020-11-15 |
|
32 |
2020-04-12 |
更新了故障部件模式事件类告警。 |
31 |
2019-11-11 |
更新了ALM-0x0100003B 内存温度过高(Memory,轻微告警)和ALM-0x1A000031 Nand Flash预留块低于阈值(BMC,严重告警)。 |
30 |
2019-09-05 |
更新了内存告警。 |
29 |
2019-07-30 |
手册更名。 |
28 |
2019-05-30 |
|
27 |
2019-02-22 |
iBMC V328及以上版本起,主体类型为RAID Card、PSU的告警分别支持上报各自的序列号和BOM编码,主体类型为Fan的告警支持上报BOM编码。 |
26 |
2018-11-21 |
|
25 |
2018-11-05 |
iBMC V316及以上版本起,主体类型为CPU、Disk的告警分别支持上报各自的序列号和BOM编码,主体类型为Mainboard、Memory的告警分别支持上报BOM编码。 |
24 |
2018-08-08 |
|
23 |
2018-07-05 |
更新了ALM-0x08000003 PCIe卡温度过高(PCIe Card,轻微告警)、ALM-0x08000017 PCIe标卡电压读取失败(PCIe Card,轻微告警)、ALM-0x08000005 PCIe标卡温度读取失败(PCIe Card,轻微告警)。 |
22 |
2018-05-30 |
|
21 |
2018-05-14 |
|
20 |
2018-03-29 |
|
19 |
2018-02-11 |
|
18 |
2017-12-28 |
新增ALM-0x12000019 右挂耳不在位(Chassis,轻微告警)、ALM-0x23000031 I/O板缓起电路温度过高(I/O Board,严重告警)、ALM-0x24000009 CPU板缓起电路温度过高(CPU Board,严重告警)告警。 |
17 |
2017-10-27 |
0x06000007告警新增一个告警参数。 |
16 |
2017-10-12 |
告警合一。 |
15 |
2017-08-04 |
修改C30相关告警。 |
14 |
2017-07-30 |
修改C50相关告警。 |
13 |
2017-07-07 |
整改V3产品的告警。 |
12 |
2017-06-01 |
发布C50告警。 |
11 |
2017-05-01 |
修改0x0147FFFF的告警传感器。 |
10 |
2016-12-01 |
修改0C07FFFF的告警名称。 |
09 |
2016-10-28 |
修改描述信息。 |
08 |
2016-09-10 |
修改传感器名称。 |
07 |
2016-07-13 |
整改格式。 |
06 |
2015-11-27 |
增加电源告警。 |
05 |
2015-04-20 |
|
04 |
2015-03-20 |
所有机架服务器的告警合并为一本手册。 |
03 |
2014-12-24 |
修改了产品名称。 |
02 |
2014-10-25 |
修改了温度告警。 |
01 |
2014-04-20 |
第一次正式发布。 |