所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

G2500 服务器 1.0.0 iBMC 告警处理 02

评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
事件类告警

事件类告警

事件类告警为服务器的日常运行记录,不需要立即进行处理,在不影响服务器业务的情况下,可于业务量较少的时段进行定位处理。服务器支持的事件类告警如表11-1所示。

表11-1  事件类告警列表

事件码

事件描述

影响/建议

0x00000015

CPU arg1 installed.

说明:

arg1:表示CPU编号。

0x00000017

CPU arg1 removed.

说明:

arg1:表示CPU编号。

影响:

  • 若CPU1产生此告警,会导致服务器操作系统无法启动。

  • 若其它CPU产生此告警,会降低服务器性能。

建议:在合适的时间安装告警的CPU。

0x0000001F

CPU arg1 Core arg2 isolated.

说明:
  • arg1:表示CPU编号。

  • arg2:表示内核编号。

影响:降低CPU性能。

建议:在合适的时间更换告警的CPU。

0x0100000D

[Memory board arg1] arg2 memory correctable ECC.

说明:
  • arg1:表示告警相关内存板的槽位号。
  • arg2:表示告警相关内存丝印,或CPU槽位号和通道号。
    • 内存丝印,例如,“DIMM020(A)”“DIMM010(B)”
    • CPU槽位号及通道号

      不同型号的服务器,同一通道对应的内存数量不同。

影响:降低系统性能。

0x0100000F

[Memory board arg1] arg2 installed.

说明:
  • arg1:表示告警相关内存板的槽位号。
  • arg2:表示告警相关内存丝印,或CPU槽位号和通道号。
    • 内存丝印,例如,“DIMM020(A)”“DIMM010(B)”
    • CPU槽位号及通道号

      不同型号的服务器,同一通道对应的内存数量不同。

0x01000011

[Memory board arg1] arg2 removed.

说明:
  • arg1:表示告警相关内存板的槽位号。
  • arg2:表示告警相关内存丝印,或CPU槽位号和通道号。
    • 内存丝印,例如,“DIMM020(A)”“DIMM010(B)”
    • CPU槽位号及通道号

      不同型号的服务器,同一通道对应的内存数量不同。

影响:降低系统性能。

建议:

  1. 在告警的内存槽位安装内存。
  2. 重新拔插告警内存。
  3. 更换告警槽位的内存。
  4. 更换主板或内存所在板卡。

0x0100002D

[arg1] arg2 health status degradation detected by PFAE.

说明:
  • arg1:表示告警相关内存板的槽位号。
  • arg2:表示告警相关内存丝印,或CPU槽位号和通道号。
    • 内存丝印,例如,“DIMM020(A)”“DIMM010(B)”
    • CPU槽位号及通道号

      不同型号的服务器,同一通道对应的内存数量不同。

影响:系统可靠性降低。

建议:

  1. 尽快安排计划性维护,下电后检查该部件与其插槽是否存在损坏或接触不良现象。
  2. 更换该部件并进一步观察。

0x02000003

The [arg1] disk arg2 installed.

说明:
  • arg1:表示硬盘位置,包括“rear”“front”
  • arg2:表示硬盘槽位号。

0x02000005

The [arg1] disk arg2 removed.

说明:
  • arg1:表示硬盘位置,包括“rear”“front”
  • arg2:表示硬盘槽位号。

0x0200000D

RAID rebuild starts at the [arg1] disk arg2.

说明:
  • arg1:表示硬盘位置,包括“rear”“front”
  • arg2:表示硬盘槽位号。

0x0200000F

RAID rebuild at the [arg1] disk arg2 is complete.

说明:
  • arg1:表示硬盘位置,包括“rear”“front”
  • arg2:表示硬盘槽位号。

0x03000003

PSU arg1 installed.

说明:

arg1:表示电源模块槽位号。

0x03000005

PSU arg1 removed.

说明:

arg1:表示电源模块槽位号。

影响:降低服务器电源冗余度。

0x04000001

Fan arg1 [arg2] installed.

说明:
  • arg1:表示风扇模块槽位号。
  • arg2:表示风扇位置,包括“rear”“front”

0x04000003

Fan arg1 [arg2] removed.

说明:
  • arg1:表示风扇模块槽位号。
  • arg2:表示风扇位置,包括“rear”“front”

影响:降低服务器风扇冗余度。

0x06000001

The RAID controller card arg1 installed.

说明:

arg1:表示RAID扣卡槽位号。

0x06000003

The RAID controller card arg1 removed.

说明:

arg1:表示RAID扣卡槽位号。

影响:RAID扣卡相关业务中断。

0x06000013

arg1 RAID card arg2 BBU is absent.

说明:
  • arg1:表示RAID卡的位置
    • FM:RAID卡位于前IO模块。
    • CMN:RAID卡位于槽位号为N的计算模块上。
  • arg2:表示RAID卡槽位号。

影响:RAID卡Cache功能失效。

0x06000023

The arg1 RAID controller card arg2 health status degradation detected by PFAE.

说明:
  • arg1:表示RAID卡的位置
    • FM:RAID卡位于前IO模块。
    • CMN:RAID卡位于槽位号为N的计算模块上。
  • arg2:表示RAID卡槽位号。

影响:系统可靠性降低。

影响:

  1. 尽快安排计划性维护,下电后检查该部件与其插槽是否存在损坏或接触不良现象。
  2. 更换该部件并进一步观察。

0x0800003D

The [arg1] PCIe card arg2 (RAID) BBU is absent.

说明:
  • arg1:表示PCIe卡的位置,包括“front”“inner”“rear”

  • arg2:表示PCIe卡槽位号。

影响:PCIe RAID卡Cache功能失效。

0x0800003F

The [arg1] PCIe card arg2 (RAID) BBU is present.

说明:
  • arg1:表示PCIe卡的位置,包括“front”“inner”“rear”

  • arg2:表示PCIe卡槽位号。

0x08000047

The [arg1] PCIe card arg2 installed.

说明:
  • arg1:表示PCIe卡的位置,包括“front”“inner”“rear”

  • arg2:表示PCIe卡槽位号。

0x08000049

The [arg1] PCIe card arg2 removed.

说明:
  • arg1:表示PCIe卡的位置,包括“front”“inner”“rear”

  • arg2:表示PCIe卡槽位号。

0x100000C3

Failed to obtain the RTC Time on the mainboard.

影响:iBMC侧日志时间不准确。

0x1200001B

The system operating temperature exceeds the short-term temperature range.

影响:工作温度长期超过规格,影响系统稳定性及寿命。

建议:

  1. 检查机房环境温度是否已超出服务器设备运行环境要求。
  2. 检查服务器进风口是否有异物堵塞。

0x1A00000D

iBMC is restarted after AC power supply is restored.

0x1A00000F

iBMC event records are cleared.

0x1A000011

iBMC event record has reached 90% space capacity.

影响:继续增长将会导致记录空间填满。

建议:清除事件记录。

0x1A00001B

iBMC operation log has reached 90% space capacity.

影响:继续使用可能会导致操作日志空间填满、部分历史操作日志丢失。

建议:

  1. 如果需要保存日志,请导出所需操作日志记录。
  2. 建议开启日志远程syslog转储功能。

0x1A00001D

iBMC security log has reached 90% space capacity.

影响:继续使用可能会导致安全日志空间填满、部分历史安全日志丢失。

建议:

  1. 如果需要保存日志,请导出所需安全日志记录。
  2. 建议开启日志远程syslog转储功能。

0x1A000021

iBMC is reset and started.

0x1A000023

arg1 certificate is about to expire or has expired.

说明:
arg1:表示证书类型。

建议:导入新证书。

0x1A000025

Heartbeat signals between the iBMC and the system management software(iBMA) are lost.

影响:带内管理监控信息无法获取或实时更新。

建议:重新安装iBMA。

0x1A000029

iBMC time is stepped by more than arg1 minutes.

说明:
arg1:表示iBMC跳变时长。

影响:可能导致iBMC日志记录时间混乱。

建议:重启iBMC。

0x1A00002B

iBMC failed to synchronize time with the NTP server.

影响:可能导致iBMC系统时间不准确。

建议:

  1. 检查NTP服务器配置是否正确。
  2. 检查iBMC和NTP服务器之间网络是否连通。
  3. 重启iBMC的NTP功能。

0x21000003

SD card arg1 removed.

说明:

arg1:表示SD卡槽位号。

影响:降低服务器存储容量。

0x29000001

arg1 [arg2] portarg3 disconnected.

说明:
  • arg1:表示网卡形态,例如:
    • NIC N:以太网卡扣卡NN为扣卡槽位号)
    • PCIe Card N:PCIe网卡标卡NN为扣卡槽位号)
    • LOM:板载网卡
  • arg2:表示网卡类型,例如“(NIC)”“(FC)”
  • arg3:表示网口编号。

影响:此网口相关业务中断。

建议:

  1. 重新拔插网线。
  2. 检查网线是否连接到对端设备。
  3. 检查对端设备工作是否正常。

0x2C000009

ACPI is in the working state.

0x2C00000B

ACPI is in the soft-off state.

影响:服务器可能无法正常上电。

0x2C00002F

The server system crashes or is abnormally reset.

影响:服务器操作系统异常,相关业务中断。

0x2C000063

The host was restarted by the BMC.

影响:系统重启,导致服务器业务中断。

0x31000001

The power button on the panel is pressed.

影响:服务器操作系统下电。

0x2C00000F

The host was restarted due to unrecognized reason.

影响:可能导致服务器业务中断。

0x2C000011

The host was restarted by command.

影响:可能导致服务器业务中断。

0x2C000013

The host was restarted by power button.

影响:可能导致服务器业务中断。

0x2C000015

The host was restarted due to watchdog timeout.

影响:可能导致服务器业务中断。

0x2C000017

The host is restarted after being powered on (Power strategy is "Turn On").

影响:可能导致服务器业务中断。

0x2C000019

The host is restarted after being powered on (Power strategy is "Restore Previous State").

影响:可能导致服务器业务中断。

0x2C00001B

The OS cannot start without a boot device.

影响:服务器操作系统无法启动。

0x2C00001D

The OS cannot start without a bootable disk.

影响:服务器操作系统无法启动。

0x2C00001F

The OS cannot start because the PXE service is unavailable.

影响:服务器操作系统无法启动。

0x2C000021

The OS cannot start due to the invalid boot partition.

影响:服务器操作系统无法启动。

0x2C000023

The watchdog(arg1) timed out.

说明:

arg1:表示看门狗类型,包括“BIOS FRB2”“BIOS/POST”“OS Load”“SMS/OS”“OEM”

0x31000003

The UID button on the panel is pressed.

翻译
下载文档
更新时间:2018-10-09

文档编号:EDOC1100010994

浏览量:9882

下载量:33

平均得分:
本文档适用于这些产品
相关文档
相关版本
Share
上一页 下一页