TaiShan 机架服务器 iBMC 告警处理 20

前言

前言

概述

本文档针对服务器iBMC的各类告警,从告警含义、对系统的影响、可能的原因、解决的步骤等方面进行详细的介绍。

本文档适用于:TaiShan 100、TaiShan 200和TaiShan 200 Pro服务器

本文档不包含:TaiShan 200(2280, VF)服务器

读者对象

本文档主要适用于以下人员:

  • 技术支持工程师
  • 维护工程师

符号约定

在本文中可能出现下列标志,它们所代表的含义如下。

符号

说明

表示如不避免则将会导致死亡或严重伤害的具有高等级风险的危害。

表示如不避免则可能导致死亡或严重伤害的具有中等级风险的危害。

表示如不避免则可能导致轻微或中度伤害的具有低等级风险的危害。

用于传递设备或环境安全警示信息。如不避免则可能会导致设备损坏、数据丢失、设备性能降低或其它不可预知的结果。

“须知”不涉及人身伤害。

对正文中重点信息的补充说明。

“说明”不是安全警示信息,不涉及人身、设备及环境伤害信息。

修订记录

修改记录累积了每次文档更新的说明。最新版本的文档包含以前所有文档版本的更新内容。

文档版本

发布日期

修改说明

20

2024-04-01

19

2023-09-21

18

2022-04-01

17

2021-07-05

16

2021-06-07

更新了ALM-0x2C00002B 上电超时(System,严重告警)

15

2021-05-19

更新了故障码处理

14

2021-04-21

13

2021-02-25

更新了ALM-0x06000005 RAID扣卡故障(RAID Card,严重告警)ALM-0x06000007 RAID扣卡MCE/AER错误(RAID Card,紧急告警)ALM-0x06000025 RAID扣卡控制器通信丢失(RAID Card,严重告警)ALM-0x06000027 RAID扣卡控制器初始化异常(RAID Card,严重告警)ALM-0x06000029 获取RAID扣卡Board ID失败(RAID Card,严重告警)

12

2021-02-05

更新了事件类告警

11

2021-01-08

新增ALM-0x06000011 RAID扣卡BBU故障(RAID Card,严重告警)

10

2020-11-15

更新了ALM-0x0000001D CPU MCE/AER错误(CPU,紧急告警)ALM-0x0D000001 网卡扣卡MCE/AER错误(Network Card,紧急告警)

09

2020-07-06

更新了前言

08

2020-05-26

更新了ALM-0x1A000043 Nand Flash写入量超过门限告警(BMC,轻微告警)

07

2020-04-12

更新了事件类告警

06

2020-01-03

更新了事件类告警

05

2019-11-11

更新了前言

04

2019-09-30

新增以下告警:

03

2019-07-01

更新了ALM-0x100000EB 主板光模块温度过高(Mainboard,轻微告警)ALM-0x100000ED 主板光模块温度读取失败(Mainboard,轻微告警)

02

2019-06-14

01

2018-11-05

第一次正式发布。

翻译
收藏
下载文档
更新时间:2024-04-01
文档编号:EDOC1100048793
浏览量:276711
下载量:3801
平均得分:4.4