所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

S9300, S9300E, S9300X V200R013C00 告警处理

本文档介绍了设备支持的告警,内容包含告警解释、告警属性、告警参数、告警原因、告警处理。
评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
BASETRAP

BASETRAP

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.1.1 hwEntityRemove

告警解释

BASETRAP/4/ENTITYREMOVE: OID [oid] Physical entity is removed. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], ContainedIn=[INTEGER], PhysicalName="[OCTET]")

物理实体(包括单板、子卡,电源、风扇、光模块等)被拔出时产生该告警。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.1.1 Warning equipmentAlarm (5)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,实体包括单板、电源、风扇,子卡。
Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

1024:IANAITUPROBABLECAUSE_OTHER 未知原因。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是equipmentAlarm (5) 设备告警。

ContainedIn 该告警所对应的实体父索引。

1)如果实体是单板、风扇、电源,则其父索引是单板、风扇、电源所在的槽位索引。

2)如果实体是子卡,则其父索引是子卡所在单板上插子卡的子槽位的索引。

PhysicalName 该告警所对应的实体物理名称。如线路板名称为“LE01G48SC”。

对系统的影响

如果是接口板,该板上运行的所有业务中断。

如果是主控板,会影响系统可靠性,如果拔出的是主用主控板,则会发生主备倒换,可能会中断整机所有业务。

如果是光模块,拔出该光模块造成对应端口的业务中断。

可能原因

实体被拔出。

处理步骤

  1. 确认该槽位单板拔出是否属于正常操作,比如正常维护。

    • 是,=>7
    • 否,=>2

  2. 根据告警中上报的槽位号,确认是否是主控板被拔出。

    • 是,=>4
    • 否,=>3

  3. 可根据实际情况选择是否需要重新插入单板。

    • 是,=>4
    • 否,=>7

  4. 插入相应的单板,等待单板启动成功,执行命令display device检查对应槽位的单板是否注册成功。

    • 是,=>7
    • 否,=>请收集告警信息和配置信息,并联系技术支持人员。

  5. 确认EntPhysicalName对应的端口的光模块是否被拔出。

    • 是,=>7
    • 否,=>6

  6. 插拔光模块,使得光模块插牢固。

    • 如果有光模块插入的告警,=>7
    • 如果没有光模块插入的告警,=>请收集告警信息和配置信息,并联系技术支持人员。

  7. 结束。

    确认故障排除的方法:

    1. 在网管上不再出现该告警。
    2. 使用命令display trapbuffer查看Trapbuffer中的内容,不再有该告警产生。
    3. 使用命令terminal monitorterminal trapping打开屏显告警,不再有该告警产生。
    说明:

    对于支持热插拔的子卡,此告警属于提示性信息,无需处理;对于不支持热插拔的子卡,出现此告警后,需要重启设备才能恢复业务。子卡对于热插拔的具体支持情况,请您参见《硬件描述》中对应子卡介绍章节。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.1.2 hwEntityInert

告警解释

BASETRAP/4/ENTITYINSERT: OID [oid] Physical entity is inserted. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], ContainedIn=[INTEGER], PhysicalName="[OCTET]")

物理实体(包括单板、电源、风扇等)被插入时产生该告警。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.1.2 Warning equipmentAlarm (5)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,实体包括单板、电源、风扇,子卡。
Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

1024:IANAITUPROBABLECAUSE_OTHER 未知原因。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是equipmentAlarm (5) 设备告警。

ContainedIn 该告警所对应的实体父索引。

1)如果实体是单板、风扇、电源,则其父索引是单板、风扇、电源所在的槽位索引。

2)如果实体是子卡,则其父索引是子卡所在单板上插子卡的子槽位的索引。

PhysicalName 该告警所对应的实体物理名称。如线路板名称为“LE01G48SC”。

对系统的影响

无。

可能原因

实体被插入。

处理步骤

  1. 提示性信息,无需处理。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.1.5 hwEntityReset

告警解释

BASETRAP/4/ENTITYRESET: OID [oid] Physical entity is reset. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], ContainedIn=[INTEGER], PhysicalName="[OCTET]", RelativeResource="[OCTET]", ReasonDescription="[OCTET]")

单板复位。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.1.5 Warning processingErrorAlarm(4)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,实体包括单板、电源、风扇,子卡。
Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

1)1024:IANAITUPROBABLECAUSE_OTHER 未知原因。

2)153:IANAITUPROBABLECAUSE_CORRUPTDATA 数据被破坏。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是processingErrorAlarm (4) 处理出错告警。

ContainedIn 该告警所对应的实体父索引。这里的指插入单板的槽位索引。
PhysicalName 该告警所对应的实体物理名称。如线路板名称为“LE01G48SC”。
RelativeResource 该告警所关联的器件名。
ReasonDescription

该告警所产生原因的描述。

对系统的影响

该单板上的相关业务中断。

可能原因

单板异常。

处理步骤

  1. 系统视图下执行display reset-reason [ slot slot-id ]命令,查看单板复位的原因。
  2. 根据单板复位原因判断是否是正常维护拔出单板。

    • 是,=>结束。
    • 否,=>请收集告警信息和配置信息,并联系技术支持人员。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.1.6 hwEntityResetDone

告警解释

BASETRAP/4/ENTITYRESETDONE: OID [oid] Physical entity resetting ended. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], ContainedIn=[INTEGER], PhysicalName="[OCTET]", RelativeResource="[OCTET]", ReasonDescr="[OCTET]")

单板复位。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.1.6 Warning processingErrorAlarm(4)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,实体包括单板、电源、风扇,子卡。
Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

1)1024:IANAITUPROBABLECAUSE_OTHER 未知原因。

2)153:IANAITUPROBABLECAUSE_CORRUPTDATA 数据被破坏。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是processingErrorAlarm (4) 处理出错告警。

ContainedIn 该告警所对应的实体父索引。这里的指插入单板的槽位索引。
PhysicalName 该告警所对应的实体物理名称。如线路板名称为“LE01G48SC”。
RelativeResource 该告警所关联的器件名。
ReasonDescr 该告警所产生原因的描述。

对系统的影响

不会影响业务。

可能原因

单板复位结束。

处理步骤

  1. 单板启动成功,无需处理。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.1.7 hwEntityCommunicateError

告警解释

BASETRAP/1/ENTCOMMUNICATEERROR: OID [oid] Communication channel failed. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], ContainedIn=[INTEGER], PhysicalName="[OCTET]", RelativeResource="[OCTET]", ReasonDescription="[OCTET]")

CANbus通信丢失。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.1.7 Critical communicationsAlarm(2)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,此处实体指单板。
Severity 该告警的告警级别。
ProbableCause 告警错误码:140312。
EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是communicationsAlarm (2) 通讯告警。

ContainedIn 该告警所对应的实体父索引。这里的该告警所对应的实体父索引指插入单板的槽位索引。
PhysicalName 该告警所对应的实体物理名称。
RelativeResource 该告警所关联的器件名。
ReasonDescription 该告警所产生原因的描述。

对系统的影响

CANbus不通导致设备部分业务或全部业务中断。

可能原因

  • 单板松动未插紧。
  • 由于CANbus异常,引发通信丢失告警。

处理步骤

  1. 重新拔插单板,查看是否上报恢复告警。
    • 是,=>结束。
    • 否,=>请收集告警信息和配置信息,并联系技术支持人员。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.1.8 hwEntityCommunicateResume

告警解释

BASETRAP/4/ENTCOMMUNICATERESUME: OID [oid] Communication channel recovered from a failure. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], ContainedIn=[INTEGER], PhysicalName="[OCTET]", RelativeResource="[OCTET]", ReasonDescription="[OCTET]")

CANbus通信恢复时发送的告警。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.1.8 Warning communicationsAlarm(2)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,此处实体指单板。
Severity 该告警的告警级别。
ProbableCause 告警错误码:140312。
EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是communicationsAlarm (2) 通讯告警。

ContainedIn 该告警所对应的实体父索引。这里的该告警所对应的实体父索引指插入单板的槽位索引。
PhysicalName 该告警所对应的实体物理名称。如线路板名称为“LE01G48SC”。
RelativeResource 该告警所关联的器件名。
ReasonDescription 该告警所产生原因的描述。

对系统的影响

无。

可能原因

松动单板已插紧、CANbus故障恢复或插入了可以供电的电源模块。

处理步骤

  • 提示性信息,无需处理。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.1.9 hwEntityInvalid

告警解释

BASETRAP/1/ENTITYINVALID: OID [oid] Physical entity failed. (EntityPhysicalIndex=[INTEGER], BaseTrapSeverity=[INTEGER], BaseTrapProbableCause=[INTEGER], BaseTrapEventType=[INTEGER], EntPhysicalContainedIn=[INTEGER], EntPhysicalName="[OCTET]", RelativeResource="[OCTET]", ReasonDescription="[OCTET]")

物理器件故障。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.1.9 Critical equipmentAlarm(5)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
EntityPhysicalIndex 物理索引。
BaseTrapSeverity 告警级别。
BaseTrapProbableCause 告警可能原因。
BaseTrapEventType 告警类型。
EntPhysicalContainedIn 告警对应的实体父索引。
EntPhysicalName 告警所对应的实体名称。
RelativeResource 关联器件名。
ReasonDescription 告警产生原因的描述。

对系统的影响

故障对应单板不可用并且单板的业务可能中断。发生PHY故障时,单板的RUN灯关闭,Alarm灯红色常亮。

可能原因

原因1:

插入的光模块为非华为认证光模块。如果是华为早期发货的光模块,可能因为当时没有记录厂商信息而产生此告警。

原因2:

CPU和PCI桥的链路异常。

原因3:

CPU和网络转发模块的链路异常。

原因4:

FPGA异常。

原因5:

NP异常。

原因6:

锁相环异常。

原因7:

CPLD异常。

原因8:

CPU和PCI-PCIE桥间链路异常。

原因9:

芯片物理端口异常。

原因10:

风扇异常。

原因11:

监控板异常。

原因12:

Flash操作错误。

原因13:

PHY异常。

原因14:

TCAM异常。

原因15:

RTC异常。

处理步骤

  1. 对于非华为认证光模块告警(原因1),按照以下步骤处理。

    1. 如果是华为早期发货的光模块,不需要关注该告警,则可以使用命令transceiver phony-alarm-disable关闭非华为认证光模块告警功能。如果无法确认光模块是否为华为早期发货的光模块,请联系技术支持人员。
    2. 如果不是华为认证光模块,建议更换为华为认证光模块。判断是否是华为认证光模块的方法为:
      1. 执行命令display transceiver查看光模块信息,如果厂商字段“Vendor Name”显示不是“HUAWEI”,那么该光模块不是华为认证光模块。
      2. 执行命令undo transceiver phony-alarm-disable打开华为非认证光模块告警功能,如果针对该光模块产生了非认证光模块告警,则说明该光模块不是华为认证的光模块。
        说明:

        华为认证光模块识别功能从V200R001版本开始支持。

        版本上定义电子标签生产日期为2013年7月1日(对于QSFP+封装的40GE光模块和CFP封装的40GE和100GE光模块,这个时间是2016年1月1日)或者以后的单板为新单板。对于新单板,如果插入的光模块为非认证光模块,则定时告警。对于老单板,则不会告警。

  2. 对于其它故障,重启单板,查看故障是否恢复。

    • 是,=>结束。
    • 否,=>3

  3. 更换单板,查看故障是否恢复。

    • 是,=>结束。
    • 否,=>请收集告警信息和配置信息,并联系技术支持人员。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.1.10 hwEntityResume

告警解释

BASETRAP/4/ENTITYRESUME: OID [oid] Physical entity recovered from a failure. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER] , EventType=[INTEGER], ContainedIn=[INTEGER], PhysicalName="[OCTET]", RelativeResource="[OCTET]", ReasonDescr="[OCTET]")

物理器件故障恢复。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.1.10 Warning equipmentAlarm(5)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
EntityPhysicalIndex 物理索引。
BaseTrapSeverity 告警级别。
BaseTrapProbableCause 告警可能原因。
BaseTrapEventType 告警类型。
EntPhysicalContainedIn 告警对应的实体父索引。
EntPhysicalName 该告警所对应的实体名称,根据类型不同,实体名也不同,如MPU Board 4 | LPU Board 1| Power Board 24。
RelativeResource 关联器件名。
ReasonDescription 该告警产生原因的描述。

对系统的影响

可能原因

原因1:

BCM54980物理端口GE异常恢复。

原因2:

CPU和PCI桥的链路异常恢复。

原因3:

CPU和网络转发模块的链路异常恢复。

原因4:

BCM88230的端口异常恢复。

原因5:

FPGA异常恢复。

原因6:

NP异常恢复。

原因7:

锁相环异常恢复。

原因8:

CPLD异常恢复。

原因9:

CPU和PCI-PCIE桥间链路异常恢复。

原因10:

网络转发模块FE物理端口异常恢复。

原因11:

BCM8754 XGE物理端口异常恢复。

原因12:

风扇异常恢复。

处理步骤

  1. 提示性信息,无需处理。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.1.12 hwEntityBecomeMaster

告警解释

BASETRAP/4/ENTITYBECOMEMASTER: OID [oid] Physical entity changed to the master state. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], ContainedIn=[INTEGER], PhysicalName="[OCTET]", RelativeResource="[OCTET]", ReasonDescr="[OCTET]")

实体由备用状态切为主用状态。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.1.12 Warning processingErrorAlarm(4)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引。
Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

612:IANAITUPROBABLECAUSE_OUTOFSERVICE主控板异常不能正常提供服务。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是processingErrorAlarm (4) 处理出错告警。

ContainedIn

该告警所对应的实体父索引。

PhysicalName 该告警所对应的实体物理名称。
RelativeResource 该告警所关联的器件名。
ReasonDescription 该告警所产生原因的描述。

对系统的影响

无。

可能原因

原因1:

人为主备倒换。

原因2:

原来的主用单板发生异常。

处理步骤

  1. 发生该告警时,主用主控板会复位。等待3分钟左右时间后,根据告警信息提示显示的告警主控板的槽位号,在用户视图下使用命令display device定位主备倒换原因。

    • 如果倒换后的备板能够注册成功,可能是命令行倒换,无需处理=>3。
    • 如果倒换后备板不能够注册成功,可能是主用板故障或异常复位导致的主备倒换=>2。

  2. 请更换主用主控板。
  3. 请确认故障是否排除。

    确认故障排除的方法:

    • 在网管界面上不再出现该告警。
    • 使用命令display trapbuffer查看Trapbuffer中的内容,不再有该告警产生。
    • 使用命令terminal monitorterminal trapping打开屏显告警,不再有该告警产生。
    • 倒换后3-4分钟,使用display device命令查看备用主控板注册成功。
      • 是,=>结束。
      • 否,=>请收集告警信息和配置信息,并联系技术支持人员。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.1.18 hwEntityRegSuccess

告警解释

BASETRAP/4/ENTITYREGSUCCESS: OID [oid] Physical entity registered successfully. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], ContainedIn=[INTEGER], PhysicalName="[OCTET]", RelativeResource="[OCTET]", ReasonDescription="[OCTET]")

单板注册成功。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.1.18 Warning operationalViolation(8)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,此处实体指单板。
Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

1024:IANAITUPROBABLECAUSE_OTHER 未知原因。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。
  • operationalViolation (8) 操作告警。

该告警对应的是perationalViolation (8) 操作告警。

ContainedIn 该告警所对应的实体父索引。这里的指插入单板的槽位索引。
PhysicalName 该告警所对应的实体物理名称。如线路板名称为“LE01G48SC”。
RelativeResource 该告警所关联的器件名。
ReasonDescription 该告警所产生原因的描述。

对系统的影响

无。

可能原因

实体(指单板)注册成功。

处理步骤

  1. 提示性信息,无需处理。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.2.1 hwTempRisingAlarm

告警解释

BASETRAP/3/TEMRISING: OID [oid] Temperature exceeded the upper pre-alarm limit. (Index=[INTEGER], BaseThresholdPhyIndex=[INTEGER], ThresholdType=[ INTEGER], ThresholdIndex=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], PhysicalName="[OCTET]", ThresholdValue=[INTEGER], ThresholdUnit=[INTEGER], ThresholdHighWarning=[INTEGER], ThresholdHighCritical=[INTEGER])

当实体(单板或者单板上的子卡)上传感器读出的温度值超过该传感器允许的最高阈值时,产生温度过高的告警。

该最高值由传感器的硬件特性决定。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.2.1 Minor environmentalAlarm(6)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,此处指单板。
BaseThresholdPhyIndex 该告警所对应的实体索引,温度告警中,实体包括:单板、风扇、电源。
ThresholdType 产生阈值告警的类型。具体可能的类型如下:

1)temperatureSensor:温度传感器。

2)humiditySensor:湿度传感器。

3)voltageSensor:电压传感器。

4)currentSensor:电流传感器。

5)powerSensor:功率传感器。

6)portTraffic:端口流量。

7)portCrcError:端口CRC校验。

8)portBroadcast:端口广播。

该告警中对应的是temperatureSensor:温度传感器。

Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

102:IANAITUPROBABLECAUSE_airConditioningFailure 风扇故障。

EventType 告警类型。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是environmentalAlarm (6) 环境告警。

PhysicalName 该告警所对应的物理实体名称。
ThresholdIndex 实体上产生告警的实体子索引。当单板上有多个温度传感器时,多个温度传感器用子索引标识。
ThresholdValue 当前温度值,通过命令display temperature all可以查看当前单板上的温度值。
ThresholdUnit 度量单位。对应温度的度量单位是:

2:THRESHOLDUNIT_CENTIGRADE1 温度单位,摄氏度。

ThresholdHighWarning 产生轻度告警的温度阈值,温度阈值由传感器的硬件特性决定,通过命令display temperature all可以查看单板上传感器的阈值。
ThresholdHighCritical 产生紧急告警的温度阈值,该值目前与产生轻度告警的温度阈值ThresholdHighWarning相同。

对系统的影响

温度过高可能导致器件工作异常,影响业务。

可能原因

  • 设备排风不畅,导致热量散发不畅。

  • 防尘网堵塞。

  • 空闲槽位未插入假面板。

  • 设备所处环境温度过高。

  • 设备的风扇数量不足。

  • 设备的风扇发生故障。

处理步骤

  1. 清洁风扇防尘网以及风扇散热区周围堵塞物,检查空闲的槽位是否已经插入假面板,保证排风通畅,并检查告警是否被消除。

    • 是,=>结束。
    • 否,=>2

  2. 查看设备所处环境温度是否过高。

    • 是,=>3
    • 否,=>4

  3. 降低机房环境温度=>4。
  4. 查看设备风扇槽位是否都插入的风扇。

    • 是,=>6
    • 否,=>5

  5. 增加风扇数量=>6。
  6. 通过命令display fan查看风扇状态信息,检查风扇是否发生故障。

    • 是,=>7
    • 否,=>8

  7. 更换发生故障的风扇=>8。
  8. 设备运行一段时间后,通过display temperature all命令查看设备温度信息,查看是否仍然存在温度过高的情况。

    • 是,=>9
    • 否,=>结束。

  9. 请收集告警信息和配置信息,并联系技术支持人员。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.2.2 hwTempRisingResume

告警解释

BASETRAP/4/TEMRISINGRESUME: OID [oid] Temperature recovered to the normal range and the high temperature alarm was cleared. (Index=[INTEGER], BaseThresholdPhyIndex=[INTEGER], ThresholdType=[INTEGER], ThresholdIndex=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], PhysicalName="[OCTET]", ThresholdValue=[INTEGER], ThresholdUnit=[INTEGER], ThresholdHighWarning=[INTEGER], ThresholdHighCritical= [INTEGER])

实体从温度过高状态恢复到正常状态。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.2.2 Warning environmentalAlarm(6)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,此处指单板。
BaseThresholdPhyIndex 该告警所对应的实体索引,温度告警中,实体包括:单板、风扇,电源。
ThresholdType 产生阈值告警的类型。具体可能的类型如下:

1)temperatureSensor:温度传感器。

2)humiditySensor:湿度传感器。

3)voltageSensor:电压传感器。

4)currentSensor:电流传感器。

5)powerSensor:功率传感器。

6)portTraffic:端口流量。

7)portCrcError:端口CRC校验。

8)portBroadcast:端口广播。

该告警中对应的是temperatureSensor:温度传感器。

Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

130:IANAITUPROBABLECAUSE_lowTemperatue降温处理。

EventType 告警类型。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是environmentalAlarm (6) 环境告警。

PhysicalName 该告警所对应的物理实体名称。
ThresholdIndex 实体上产生告警的实体子索引。当单板上有多个温度传感器时,多个温度传感器用子索引标识。
ThresholdValue 当前温度值,通过命令display temperature all可以查看当前单板上的温度值。
ThresholdUnit 度量单位。对应温度的度量单位是:

2:THRESHOLDUNIT_CENTIGRADE1 温度单位,摄氏度。

ThresholdHighWarning 产生轻度告警的温度阈值,温度阈值由传感器的硬件特性决定,通过命令display temperature all可以查看单板上传感器的阈值。
ThresholdHighCritical 产生紧急告警的温度阈值,该值目前与产生轻度告警的温度阈值ThresholdHighWarning相同。

对系统的影响

无。

可能原因

实体由于温度超过传感器允许的最大值,产生了温度过高的告警后,采取降温措施,使温度低于传感器允许的最高值。

处理步骤

  1. 提示性信息,无需处理。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.2.9 hwVoltRisingAlarm

告警解释

BASETRAP/1/VOLTRISING: OID [oid] Voltage exceeded the upper pre-alarm limit. (Index=[INTEGER], BaseThresholdPhyIndex=[INTEGER], ThresholdType=[INTEGER], ThresholdIndex=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], PhysicalName="[OCTET]", ThresholdValue=[INTEGER], ThresholdUnit=[INTEGER], ThresholdHighWarning=[INTEGER], ThresholdHighCritical= [INTEGER])

电压过高,超过最高阈值。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.2.9 Critical environmentalAlarm(6)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,此处实体指单板。
BaseThresholdPhyIndex 该告警所对应的实体索引,电压告警中,实体包括:单板、风扇,电源。
ThresholdType 产生阈值告警的类型。具体可能的类型如下:

1)temperatureSensor:温度传感器。

2)humiditySensor:湿度传感器。

3)voltageSensor:电压传感器。

4)currentSensor:电流传感器。

5)powerSensor:功率传感器。

6)portTraffic:端口流量。

7)portCrcError:端口CRC校验。

8)portBroadcast:端口广播。

该告警中对应的是voltageSensor:电压传感器。

Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

533:IANAITUPROBABLECAUSE_POWERPROBLEMS电源问题。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是environmentalAlarm (6) 环境告警。

PhysicalName 该告警所对应的实体物理名称。
ThresholdIndex 实体上产生告警的实体子索引。当单板上有多个电压传感器时,多个电压传感器用子索引标识。
ThresholdValue 当前电压值,通过命令display voltage all可以查看当前设备上各单板上电压传感器检测的电压值和阈值。
ThresholdUnit 度量单位。对应温度的度量单位是:

4:THRESHOLDUNIT_VOLTAGE1 电压单位,V。

ThresholdHighWarning 产生轻度告警的电压阈值,电压阈值由传感器的硬件特性决定,执行命令display voltage all可以查看单板上传感器的阈值。
ThresholdHighCritical 产生紧急告警的电压阈值,该值目前与产生轻度告警的电压阈值ThresholdHighWarning相同。

对系统的影响

如果是硬件故障,则相关业务会受到影响。

可能原因

原因1:电源模块故障。

原因2:单板故障。

处理步骤

  1. 排查是否有电源模块发生硬件故障。

    • 是,=>2
    • 否,=>3

    排查方法:用一个正常工作的电源逐个替换设备上的电源模块,每替换一个,都执行命令display voltage slot slot-id查看各单板的电压情况,如果电压恢复正常,则说明被替换的电源发生了硬件故障。

  2. 更换发生故障的电源模块。执行命令display voltage slot slot-id查看告警单板的电压是否正常。

    • 是,=>结束。
    • 否,=>3

  3. 重启单板,查看告警是否消除。

    • 是,=>结束。
    • 否,=>4

  4. 更换单板,查看告警是否消除。

    • 是,=>结束。
    • 否,=>请收集告警信息和配置信息,并联系技术支持人员。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.2.10 hwVoltRisingResume

告警解释

BASETRAP/4/VOLTRISINGRESUME: OID [oid] Voltage recovered to the normal range and the high voltage alarm was cleared. (Index=[INTEGER], BaseThresholdPhyIndex=[INTEGER], ThresholdType=[INTEGER], ThresholdIndex=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], PhysicalName="[OCTET]", ThresholdValue=[INTEGER], ThresholdUnit=[INTEGER], ThresholdHighWarning=[INTEGER], ThresholdHighCritical=[INTEGER])

电压从过高状态恢复到正常状态。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.2.10 Warning environmentalAlarm(6)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,此处实体指单板。
BaseThresholdPhyIndex 该告警所对应的实体索引,电压告警中,实体包括:单板、风扇,电源。
ThresholdType 产生阈值告警的类型。具体可能的类型如下:

1)temperatureSensor:温度传感器。

2)humiditySensor:湿度传感器。

3)voltageSensor:电压传感器。

4)currentSensor:电流传感器。

5)powerSensor:功率传感器。

6)portTraffic:端口流量。

7)portCrcError:端口CRC校验。

8)portBroadcast:端口广播。

该告警中对应的是voltageSensor:电压传感器。

Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

115:IANAITUPROBABLECAUSE_rectifierHighVoltage高电压状态已经调整。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是environmentalAlarm (6) 环境告警。

PhysicalName 该告警所对应的实体物理名称。
ThresholdIndex 实体上产生告警的实体子索引。当单板上有多个电压传感器时,多个电压传感器用子索引标识。
ThresholdValue 当前温度值,通过命令display voltageall可以查看当前单板上的电压当前值和阈值。
ThresholdUnit 度量单位。对应温度的度量单位是:

4:THRESHOLDUNIT_VOLTAGE1 电压单位,V。

ThresholdHighWarning 产生轻度告警的电压阈值,电压阈值由传感器的硬件特性决定,通过命令display voltageall可以查看单板上传感器的阈值。
ThresholdHighCritical 产生紧急告警的电压阈值,该值目前与产生轻度告警的电压阈值ThresholdHighWarning相同。

对系统的影响

无影响。

可能原因

原因1:

电源故障排除。

原因2:

单板故障排除。

处理步骤

  1. 提示性信息,无需处理。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.2.11 hwVoltFallingAlarm

告警解释

BASETRAP/1/VOLTFALLING: OID [oid] Voltage has fallen below the lower pre-alarm limit. (Index=[INTEGER], BaseThresholdPhyIndex=[INTEGER], ThresholdType=[INTEGER], ThresholdIndex=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], PhysicalName="[OCTET]", ThresholdValue=[INTEGER], ThresholdUnit=[INTEGER], ThresholdLowWarning=[INTEGER], ThresholdLowCritical=[INTEGER])

电压过低,超过最低阈值。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.2.11 Critical environmentalAlarm(6)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,此处实体指单板。
BaseThresholdPhyIndex 该告警所对应的实体索引,电压告警中,实体包括:单板、风扇、电源。
ThresholdType 产生阈值告警的类型。具体可能的类型如下:

1)temperatureSensor:温度传感器。

2)humiditySensor:湿度传感器。

3)voltageSensor:电压传感器。

4)currentSensor:电流传感器。

5)powerSensor:功率传感器。

6)portTraffic:端口流量。

7)portCrcError:端口CRC校验。

8)portBroadcast:端口广播。

该告警中对应的是voltageSensor:电压传感器。

Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

533:IANAITUPROBABLECAUSE_POWERPROBLEMS电源问题。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是environmentalAlarm (6) 环境告警。

PhysicalName 该告警所对应的实体物理名称。
ThresholdIndex 实体上产生告警的实体子索引。当单板上有多个电压传感器时,多个电压传感器用子索引标识。
ThresholdValue 当前电压值,通过命令display voltage all可以查看当前单板上的电压当前值和阈值。
ThresholdUnit 度量单位。对应电压的度量单位是:

4:THRESHOLDUNIT_VOLTAGE1 电压单位,V。

ThresholdLowWarning 产生轻度告警的电压阈值,电压阈值由传感器的硬件特性决定,通过命令display voltage all可以查看单板上传感器的阈值。
ThresholdLowCritical 产生紧急告警的电压阈值,该值目前与产生轻度告警的电压阈值ThresholdLowWarning相同。

对系统的影响

可能会导致单板下电,影响该单板上的业务。

可能原因

原因1:单板故障。

原因2:电源故障。

原因3:电源数量不足导致电源对系统的供电不足。

处理步骤

  1. 执行display device命令查看设备信息,检查设备上插入的电源是否都是机框支持的类型,同时检查电源数量充足,提供的功率是否能满足本机框内所有插入的单板上电。确定机框支持的电源类型请参考“硬件描述-机框-电源槽位配置”。

    • 是,=>3
    • 否,=>2

  2. 将机框不支持的电源替换成支持的电源,并且根据实际情况增加电源数量,保证电源提供的功率充足。查看告警是否恢复。

    • 是,=>结束。
    • 否,=>3

  3. 排查是否有电源模块发生硬件故障。

    • 是,=>4
    • 否,=>5

    排查方法:用一个正常工作的电源逐个替换设备上的电源模块,每替换一个,都执行命令display voltage slot slot-id查看各单板的电压情况,如果电压恢复正常,则说明被替换的电源发生了硬件故障。

  4. 更换发生故障的电源模块。执行命令display voltage slot slot-id查看告警单板的电压是否正常。

    • 是,=>结束。
    • 否,=>5

  5. 重启单板,查看告警是否消除。

    • 是,=>结束。
    • 否,=>6

  6. 更换单板,查看告警是否消除。

    • 是,=>结束。
    • 否,=>联系技术支持人员。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.2.12 hwVoltFallingResume

告警解释

BASETRAP/4/VOLTFALLINGRESUME: OID [oid] Voltage recovered to the normal range and the low voltage alarm was cleared. (Index=[INTEGER], BaseThresholdPhyIndex=[INTEGER], ThresholdType=[INTEGER], ThresholdIndex=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], PhysicalName="[OCTET]", ThresholdValue=[INTEGER], ThresholdUnit=[INTEGER], ThresholdLowWarning=[INTEGER], ThresholdLowCritical=[INTEGER])

电压从过低状态恢复到正常状态,电压过低告警恢复。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.2.12 Warning environmentalAlarm(6)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,电压告警中,实体包括:单板、风扇,电源。
BaseThresholdPhyIndex 该告警所对应的实体索引,电压告警中,实体包括:单板、风扇,电源。
ThresholdType 产生阈值告警的类型。具体可能的类型如下:

1)temperatureSensor:温度传感器。

2)humiditySensor:湿度传感器。

3)voltageSensor:电压传感器。

4)currentSensor:电流传感器。

5)powerSensor:功率传感器。

6)portTraffic:端口流量。

7)portCrcError:端口CRC校验。

8)portBroadcast:端口广播。

该告警中对应的是voltageSensor:电压传感器。

Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

116:IANAITUPROBABLECAUSE_rectifierLowFVoltage 调整低电压。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是environmentalAlarm (6) 环境告警。

PhysicalName 该告警所对应的实体物理名称。
ThresholdIndex 实体上产生告警的实体子索引。当单板上有多个电压传感器时,多个电压传感器用子索引标识。
ThresholdValue 当前温度值,通过命令display voltageall可以查看当前单板上的电压当前值和阈值。
ThresholdUnit 度量单位。对应温度的度量单位是:

4:THRESHOLDUNIT_VOLTAGE1 电压单位,V。

ThresholdLowWarning 产生轻度告警的电压阈值,电压阈值由传感器的硬件特性决定,通过命令display voltageall可以查看单板上传感器的阈值。
ThresholdLowCritical 产生紧急告警的电压阈值,该值目前与产生轻度告警的电压阈值ThresholdHighWarning相同。

对系统的影响

无。

可能原因

电源已经修复,单板不再是低电压状态。

处理步骤

  1. 提示性信息,无需处理。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.2.21 hwPowerInsufficiencyAlarm

告警解释

BASETRAP/2/POWERLACK: OID [oid] The available power of device is not enough for the board. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], PhysicalContainedIn=[INTEGER], PhysicalName="[OCTET]", EntityRatedPower=[INTEGER], DevAvailablePower=[INTEGER], DeviceTotalPower=[INTEGER])

当插入单板时,系统会为单板分配功率,大小为单板的额定功率。当系统的剩余功率大小小于单板的额定功率时,产生告警。

告警属性

告警ID 告警级别 告警类型

1.3.6.1.4.1.2011.5.25.129.2.2.21

Major

environmentalAlarm(6)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。

Index

该告警所对应的实体索引,功率告警中,实体指单板。

Severity

该告警的告警级别。

ProbableCause

该告警产生的可能原因。可能的原因码为:

533:IANAITUPROBABLECAUSE_POWERPROBLEMS电源问题。

EventType

告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是equipmentAlarm (5) 设备告警。

PhysicalName

该告警所对应的实体物理名称。

PhysicalContainedIn

该告警所对应的实体的父实体索引,这里指插电源板的插槽的索引。

EntityRatedPower

单板的额定功率。

DevAvailablePower

系统的剩余功率。

DeviceTotalPower

系统的总功率。

对系统的影响

要插入的单板不能上电。

可能原因

系统当前的剩余功率小于单板的额定功率。

处理步骤

  1. 通过执行display power system命令查看系统当前的总功率、剩余功率和各上电单板的额定功率。
  2. 确认是否需要插入该单板。

    • 是,=>3
    • 否,=>拔出该单板,结束。

  3. 是否有其他不需要的单板可以拔出。

    • 有,=>4
    • 无,=>无法插入该单板,结束。

  4. 拔出不需要的单板,执行命令查看剩余功率是否满足新插入单板。

    • 是,=>结束。
    • 否,=>3

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.2.22 hwPowerInsufficiencyResume

告警解释

BASETRAP/4/POWERLACKRESUME: OID [oid] The available power of the device is enough for the board. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], PhysicalContainedIn=[INTEGER], PhysicalName="[OCTET]", EntityRatedPower=[INTEGER], DevAvailablePower=[INTEGER], DeviceTotalPower=[INTEGER])

系统的剩余功率大于单板的额定功率,产生告警恢复。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.2.22 Warning equipmentAlarm(5)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。

Index

该告警所对应的实体索引,功率告警中,实体指单板。

Severity

该告警的告警级别。

ProbableCause

该告警产生的可能原因。可能的原因码为:

533:IANAITUPROBABLECAUSE_POWERPROBLEMS电源问题。

EventType

告警类别。主要的告警类型有:

  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是equipmentAlarm (5) 设备告警。

PhysicalName

该告警所对应的实体物理名称。

PhysicalContainedIn

该告警所对应的实体的父实体索引,这里指插电源板的插槽的索引。

EntityRatedPower

单板的额定功率。

DevAvailablePower

系统的剩余功率。

DeviceTotalPower

系统的总功率。

对系统的影响

无影响。

可能原因

系统的剩余功率大于单板的额定功率,能够满足单板的功率需求。

处理步骤

  1. 提示性信息,无需处理。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.3.1 hwPowerOff

告警解释

BASETRAP/1/POWEROFF: OID [oid] The power supply is off. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], ContainedIn=[INTEGER], PhysicalName="[OCTET]")

电源下电。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.3.1 Critical equipmentAlarm(5)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。

Index

该告警所对应的实体索引,电源告警中,实体指电源板。

Severity

该告警的告警级别。

ProbableCause

该告警产生的可能原因。可能的原因码为:

78:IANAITUPROBABLECAUSE_POWERSUPPLYFAILURE 电源问题。

EventType

告警类别。主要的告警类型有:

  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是equipmentAlarm (5) 设备告警。

ContainedIn

该告警所对应的实体父索引,这里指的是插电源板的槽位索引。

PhysicalName

该告警所对应的实体名称,此处是电源板名称。

对系统的影响

如果有备份电源的情况下,不影响业务。

可能原因

原因1:

人为将电源下电。

原因2:

电源模块因松动等非人为原因下电。

原因3:

电源模块故障。

处理步骤

  1. 检查是否是正常维护人为将电源下电。

    • 是,=>结束。
    • 否,=>2

  2. 检查电源开关是否处于开启状态。

    • 是,=>4。
    • 否,=>3

  3. 开启电源开关,查看是否收到上电告警。

    • 是,=>结束。
    • 否,=>4

  4. 如果是直流电源,检查连接处是否松动。

    • 是,=>5
    • 否,=>6

  5. 连接好直流电源的连接处,查看是否收到上电告警。

    • 是,=>结束。
    • 否,=>6

  6. 检查电源是否发生硬件故障。

    检查方法:使用一个正常工作的电源替换发生告警电源,查看是否收到上电告警。

    • 是,=>7
    • 否,=>请收集告警信息和配置信息,并联系技术支持人员。

  7. 更换电源模块,查看是否收到上电告警。

    • 是,=>结束。
    • 否,=>请收集告警信息和配置信息,并联系技术支持人员。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.3.2 hwPowerOn

告警解释

BASETRAP/4/POWERON: OID [oid] The power supply is on. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], ContainedIn=[INTEGER], PhysicalName="[OCTET]")

电源上电。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.3.2 Warning equipmentAlarm(5)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,电源告警中,实体指电源板。
Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

1024:IANAITUPROBABLECAUSE_OTHER 未知原因。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是equipmentAlarm (5) 设备告警。

ContainedIn 该告警所对应的实体父索引,这里指的是插电源板的槽位索引。
PhysicalName 该告警所对应的实体名称,此处是电源板名称。

对系统的影响

无。

可能原因

原因1:

电源上电。

原因2:

电源故障排除。

处理步骤

  1. 提示性信息,无需处理。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.4.1 hwCPUUtilizationRisingAlarm

告警解释

BASETRAP/2/CPUUSAGERISING: OID [oid] CPU utilization exceeded the pre-alarm threshold. (Index=[INTEGER], BaseUsagePhyIndex=[INTEGER], UsageType=[INTEGER], UsageIndex=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], PhysicalName="[OCTET]", RelativeResource="[OCTET]", UsageValue=[INTEGER], UsageUnit=[INTEGER], UsageThreshold=[INTEGER])

CPU使用率超过阈值。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.4.1 Major processingErrorAlarm(4)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,CPU告警中,实体指单板
BaseUsagePhyIndex 该告警所对应的物理实体索引,CPU告警中,实体指单板
UsageType 使用率告警类型。
UsageIndex 产生告警的实体上子实体的索引,CPU告警中恒写0。
Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

154:IANAITUPROBABLECAUSE_OUTOFCPUCYCLES CPU越界。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是processingErrorAlarm (4) 处理出错告警。

PhysicalName 该告警所对应的实体名称,此处是单板名称
RelativeResource 与告警相关联的资源,设备当前值为空。
UsageValue 当前单板的CPU使用率。
UsageUnit CPU使用率单位,百分比。
UsageThreshold CPU使用率的告警阈值。

对系统的影响

暂时对业务没有影响,但长期CPU利用率过高,可能对业务不能及时处理。

可能原因

原因1:

CPU告警阈值设置太低。

原因2:

当前设备支持的业务太多。

原因3:

设备受到攻击导致CPU资源占用过高。

处理步骤

  • 请根据《故障启示录-园区交换机-设备管理及维护》中的“CPU使用率高”进行排查。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.4.2 hwCPUUtilizationResume

告警解释

BASETRAP/4/CPUUSAGERESUME: OID [oid] CPU utilization recovered to the normal range. (Index=[INTEGER], BaseUsagePhyIndex=[INTEGER], UsageType=[INTEGER], UsageIndex=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], PhysicalName="[OCTET]", RelativeResource="[OCTET]", UsageValue=[INTEGER], UsageUnit=[INTEGER], UsageThreshold=[INTEGER])

CPU使用率恢复到正常范围。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.4.2 Warning processingErrorAlarm(4)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,CPU告警中,实体指单板
BaseUsagePhyIndex 该告警所对应的物理实体索引,CPU告警中,实体指单板
UsageType 使用率告警类型。
UsageIndex 产生告警的实体上子实体的索引,CPU告警中恒写0。
ProbableCause 该告警产生的可能原因。可能的原因码为:

1024:IANAITUPROBABLECAUSE_OTHER 未知原因。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是processingErrorAlarm (4) 处理出错告警。

PhysicalName 该告警所对应的实体名称,此处是单板名称
RelativeResource 与告警相关联的资源,设备当前值为空。
UsageValue 当前单板的CPU使用率。
UsageUnit CPU使用率单位,百分比。
UsageThreshold CPU使用率的告警阈值。

对系统的影响

可能原因

CPU使用率恢复到正常范围。

处理步骤

  1. 提示性信息,无需处理。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.5.11 hwPortPhysicalEthHalfDuplexAlarm

告警解释

BASETRAP/4/HALFDUPLEXALARM: OID [oid] The port works in half duplex mode. (EntityPhysicalIndex=[INTEGER], BaseTrapSeverity=[INTEGER], BaseTrapProbableCause=[INTEGER], BaseTrapEventType=[INTEGER], EntPhysicalName="[OCTET]", RelativeResource="[OCTET]")

端口Up、Down等事件导致协商为半双工或用户配置为半双工触发此告警。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.5.11 Warning operationalViolation(8)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
EntityPhysicalIndex 实体索引。
BaseTrapSeverity 该告警的告警级别。
BaseTrapProbableCause 该告警产生的可能原因。
BaseTrapEventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。
  • operationalViolation (8) 操作告警。

该告警对应的是operationalViolation (8) 操作告警。

EntPhysicalName 实体名称。
RelativeResource 相关资源。

对系统的影响

接口Up/Down。

可能原因

端口Up、Down等事件导致协商为半双工或用户配置为半双工。

处理步骤

  1. 判读是否通过命令duplex halfauto duplex half配置端口为半双工。

    • 是,=>无需处理,结束。
    • 否,=>2。

  2. 对端口执行一次shutdownundo shutdown后,查看端口状态是否为全双工。

    • 是,=>结束。
    • 否,=>请收集告警信息和配置信息,并联系技术支持人员。

参考信息

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.5.12 hwPortPhysicalEthFullDuplexClear

告警解释

BASETRAP/4/HALFDUPLEXCLEAR: OID [oid] The port works in full duplex mode. (EntityPhysicalIndex=[INTEGER], BaseTrapSeverity=[INTEGER], BaseTrapProbableCause=[INTEGER], BaseTrapEventType=[INTEGER], EntPhysicalName="[STRING]", RelativeResource="[STRING]")

接口工作在全双工的模式。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.5.12 Warning operationalViolation(8)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
EntityPhysicalIndex 接口索引。
BaseTrapSeverity 告警级别。
BaseTrapProbableCause 告警原因。
BaseTrapEventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。
  • operationalViolation (8) 操作告警。

该告警对应的是operationalViolation (8) 操作告警。

EntPhysicalName 接口名。
RelativeResource 关联接口,当前为空。

对系统的影响

接口Up/Down。

可能原因

接口从半双工状态变为全双工状态。

处理步骤

  1. 请根据实际组网需求判断接口当前的双工状态是否正确。

    • 正确,=>无需处理,结束。
    • 不正确,=>2

  2. 执行命令duplex halfauto duplex half配置接口为半双工。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.5.13 hwPortPhysicalPortTypeChange

告警解释

BASETRAP/4/PORTTYPECHG: OID [oid] Physical entity port type changed. (EntityPhysicalIndex=[INTEGER], BaseTrapSeverity=[INTEGER], BaseTrapProbableCause=[INTEGER], BaseTrapEventType=[INTEGER], EntPhysicalName="[OCTET]", EntityPhysicalLastPortType=[INTEGER], EntityPhysicalCurPortType=[INTEGER])

端口类型由于命令行配置发生变化时产生此通知。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.5.13 Warning operationalViolation(8)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
EntityPhysicalIndex 实体索引。
BaseTrapSeverity 该告警的告警级别。
BaseTrapProbableCause 该告警产生的可能原因。
BaseTrapEventType 告警类型。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。
  • operationalViolation (8) 操作告警。

该告警对应的是perationalViolation (8) 操作告警。

EntPhysicalName 实体名称。
EntityPhysicalLastPortType 上次的端口类型。
EntityPhysicalCurPortType 当前的端口类型。

对系统的影响

不会影响业务。

可能原因

通过命令行配置该端口类型。

处理步骤

  1. 正常信息,无需处理。

参考信息

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.6.1 hwStorageUtilizationRisingAlarm

告警解释

BASETRAP/2/STORAGEUSAGERISING: OID [oid] Storage utilization exceeded the pre-alarm threshold. (Index=[INTEGER], BaseUsagePhyIndex=[INTEGER], UsageType=[INTEGER], UsageIndex=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], PhysicalName="[OCTET]", RelativeResource="[OCTET]", UsageValue=[INTEGER], UsageUnit=[INTEGER], UsageThreshold=[INTEGER])

存储设备使用率超过阈值。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.6.1 Major processingErrorAlarm(4)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,存储器告警中实体指的是单板。
BaseUsagePhyIndex 该告警所对应的物理实体索引,存储器告警中实体指的是单板。
UsageType 使用率告警类型。
UsageIndex 产生告警的实体上子实体的索引,存储器告警中恒写0。
Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

151:IANAITUPROBABLECAUSE_STORAGECAPACITYPROBLEM 存储设备使用率问题。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。
PhysicalName 该告警所对应的实体名称。
RelativeResource 与告警相关的资源名称。
UsageValue 存储器的当前使用率。
UsageUnit 存储器使用率单位,百分比。
UsageThreshold 存储器的使用率告警阈值。

对系统的影响

影响1:如果不能及时消除该告警,导致存储空间不足,将不能继续记录日志及诊断信息,将可能导致系统运行信息及问题定位信息的缺失。

影响2:系统运行中的文件操作可能会因为存储设备空间不足而失败。

可能原因

原因1:

存储设备中保存的日志、诊断信息太多,导致空间不足。

原因2:

存储设备中保存的无用或者过期文件太多,占用存储空间,导致空间不足。

处理步骤

  1. 查看上报的告警信息中的“hwBaseUsageType”参数的值。通过命令cd cfcard:\进入CF卡目录下,然后执行命令dir查看存储设备的使用空间以及剩余空间。
  2. 执行命令dir观察告警存储器中存储的文件列表,查看文件及目录的详细信息,如文件大小、创建日志等。确定是否存在无用的、过期的、需要删除的文件。

    • 是,=>3
    • 否,=>6

  3. 删除这些文件或者将这些文件通过move命令转移到其他存储设备中。

    查看告警存储设备中的日志文件或者诊断日志文件是否过大。

    • 是,=>4
    • 否,=>5

  4. 将日志或诊断日志文件删除或者转移到其他存储设备中。
  5. 查看是否收到恢复告警。

    • 是,=>结束。
    • 否,=>请收集告警信息和配置信息,并联系技术支持人员。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.6.2 hwStorageUtilizationResume

告警解释

BASETRAP/4/STORAGEUSAGERESUME: OID [oid] Storage utilization resumed to normal range. (Index=[INTEGER], BaseUsagePhyIndex=[INTEGER], UsageType=[INTEGER], UsageIndex=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER], EventType=[INTEGER], PhysicalName="[OCTET]", RelativeResource="[OCTET]", UsageValue=[INTEGER], UsageUnit=[INTEGER], UsageThreshold=[INTEGER])

存储设备使用率阈值恢复到阈值范围内。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.6.2 Warning processingErrorAlarm(4)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
Index 该告警所对应的实体索引,存储器告警中实体指的是单板。
BaseUsagePhyIndex 该告警所对应的物理实体索引,存储器告警中实体指的是单板。
UsageType 使用率告警类型。
UsageIndex 产生告警的实体上子实体的索引,存储器告警中恒写0。
Severity 该告警的告警级别。
ProbableCause 该告警产生的可能原因。可能的原因码为:

1024:IANAITUPROBABLECAUSE_OTHER 未知原因。

EventType 告警类别。主要的告警类型有:
  • communicationsAlarm (2) 通讯告警。
  • qualityOfServiceAlarm (3) 业务质量告警。
  • processingErrorAlarm (4) 处理出错告警。
  • equipmentAlarm (5) 设备告警。
  • environmentalAlarm (6) 环境告警。

该告警对应的是processingErrorAlarm (4) 处理出错告警。

PhysicalName 该告警所对应的实体名称。
RelativeResource 与告警相关的资源名称。
UsageValue 存储器的当前使用率。
UsageUnit存贮率存储器 存储器使用率单位,百分比。
UsageThreshold 存储器的使用率告警阈值。

对系统的影响

无。

可能原因

原因1:

系统自动删除了部分过期文件。

原因2:

手工方式删除了部分文件。

处理步骤

  • 提示性信息,无需处理。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.17.1 hwOpticalPowerAbnormal

告警解释

BASETRAP/3/OPTPWRABNORMAL: OID [oid] Optical module power is abnormal. (EntityPhysicalIndex=[INTEGER], BaseTrapSeverity=[INTEGER], BaseTrapProbableCause=[INTEGER], BaseTrapEventType=[INTEGER], EntPhysicalContainedIn=[INTEGER], EntPhysicalName="[OCTET]", RelativeResource="[OCTET]", ReasonDescription="[OCTET]")

光模块的发送或者接收功率异常时发送告警。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.17.1 Minor equipmentAlarm(5)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
EntityPhysicalIndex 物理索引。
BaseTrapSeverity 告警级别。
BaseTrapProbableCause 告警可能原因。
BaseTrapEventType 告警类型。
EntPhysicalContainedIn 告警对应的实体父索引。
EntPhysicalName 该告警所对应的实体名称。
RelativeResource 实体相关资源。
ReasonDescription 该告警产生原因的描述。

对系统的影响

单独的此项告警不会对系统造成影响,以光模块对应端口的实际通信状态为准。

可能原因

告警中ReasonDescription参数描述了光功率异常的详细信息。
  • 原因1:光模块发送功率超过上门限值。ReasonDescription参数描述中包括:Overhigh sending power of fabric module

  • 原因2:光模块发送功率低于下门限值。ReasonDescription参数描述中包括:Overlow sending power of fabric module
  • 原因3:光模块接收功率超过上门限值。ReasonDescription参数描述中包括:Overhigh receiving power of fabric module
  • 原因4:光模块接收功率低于下门限值。ReasonDescription参数描述中包括:Overlow receiving power of fabric module
说明:

如果端口被shutdown、Errordown、或者设置环回,发送光功率低出阈值不会产生此告警。使能ALS功能,当链路发生故障时,端口会发出LOS信号,此时发送和接收光功率低于阈值都不会产生此告警。

处理步骤

  1. 执行命令display transceiver verbose查看发送告警的光模块的功率信息,检查光模块功率的异常情况。
  2. 检查端口状态和数据转发是否正常。

    • 正常,=>无需处理,结束。
    • 不正常,=>更换光模块或请收集告警信息和配置信息,并联系技术支持人员。

BASETRAP_1.3.6.1.4.1.2011.5.25.129.2.17.2 hwOpticalPowerResume

告警解释

BASETRAP/4/OPTPWRRESUME: OID [oid] Optical module recovered from power abnormal. (Index=[INTEGER], Severity=[INTEGER], ProbableCause=[INTEGER] , EventType=[INTEGER], ContainedIn=[INTEGER], PhysicalName="[OCTET]", RelativeResource="[OCTET]", ReasonDescr="[OCTET]")

光模块的发送或者接收功率异常恢复时发送告警。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.129.2.17.2 Warning equipmentAlarm(5)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。
EntityPhysicalIndex 物理索引。
BaseTrapSeverity 告警级别。
BaseTrapProbableCause 告警可能原因。
BaseTrapEventType 告警类型。
EntPhysicalContainedIn 告警对应的实体父索引。
EntPhysicalName 该告警所对应的实体名称。
RelativeResource 实体相关资源。
ReasonDescription 该告警产生原因的描述。

对系统的影响

可能原因

光模块功率异常恢复。

处理步骤

  1. 提示性信息,无需处理。

BASETRAP_1.3.6.1.4.1.2011.5.25.31.7.2.1 hwEntityHeartbeatTrap

告警解释

BASETRAP/4/NETWORKHEARTBEATTRAP: OID [oid] Network heart beat.

设备向网管发送在位通知,网管侧定时收到本告警,就认为设备与网管的连接正常。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.31.7.2.1 Warning communicationsAlarm(2)

告警参数

参数名称 参数含义
oid 该告警所对应的MIB节点的OID号。

对系统的影响

可能原因

当使能了网元心跳发送功能,就会定时上报该告警。

处理步骤

  1. 正常运行信息,无需处理。

参考信息

翻译
下载文档
更新时间:2019-04-09

文档编号:EDOC1100065982

浏览量:1103

下载量:47

平均得分:
本文档适用于这些产品
相关文档
相关版本
分享
上一页 下一页