所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

华为服务器 故障处理 13

用于指导用户进行故障诊断和处理,以及日常的巡检工作。
评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
根据指示灯定位故障

根据指示灯定位故障

指示灯位置请参见各服务器用户指南的外观章节。

操作流程

检查指示灯的操作流程如图6-1所示。

图6-1 指示灯检查流程图

适用于所有服务器的指示灯

  1. 检查设备的总体健康状态指示灯。

    表6-2 总体健康状态指示灯

    模块指示灯

    指示灯状态

    含义

    处理步骤及说明

    健康状态指示灯(HLY)

    绿色常亮

    表示设备运转正常

    无需任何操作。

    红色闪烁

    表示有异常告警

    1. 登录iMana 200/iBMC Web界面查看具体告警事件。
    2. (可选)查看前面板“故障诊断数码”确认具体故障码。

    电源开关指示灯(PWR)

    绿色常亮

    表示设备已正常上电

    无需任何操作。

    黄色闪烁

    表示iMana 200/iBMC管理系统正在启动,此时按电源开关按钮无法开关机

    黄色常亮

    表示设备处于待上电状态

    按PWR键开机,如果无法正常开机,请登录iMana 200/iBMC Web界面排查相关告警。

    表示设备未上电

    1. 如果iMana 200/iBMC可登录,请查看是否有告警。
    2. 对于E9000服务器,如果iMana 200/iBMC无法登录,请检查机箱后面的电源模块指示灯和管理模块指示灯是否显示正常。如果正常,则说明机箱供电正常;如果不正常,则说明机箱供电异常,请检查外部电源供电情况。
    3. 对于E9000服务器,如果确认供电正常且电源模块无异常,说明计算节点已故障,请联系华为技术支持工程师更换计算节点。不可再插拔计算节点,及尝试整框上下电。

    UID指示灯

    蓝色常亮

    表示服务器被定位

    说明:

    UID按钮/指示灯可方便地定位待操作的服务器,通过手动按UID按钮或者通过iMana 200/iBMC命令远程控制使灯灭或灯亮。

    长按定位按钮4~6秒钟,复位服务器的iMana 200/iBMC管理系统。

    表示服务器未被定位或未上电

  2. 根据具体iMana 200/iBMC系统事件日志进行故障定位。
  3. 各子部件的指示灯状态含义。

    表6-3 硬盘状态指示灯

    硬盘Active指示灯

    硬盘Fault指示灯

    含义

    处理步骤及说明

    绿色常亮

    表示硬盘工作正常

    无需任何操作。

    绿色闪烁

    表示硬盘正在读写数据

    绿色常亮

    黄色闪烁

    表示硬盘被定位或RAID重构

    绿色闪烁

    绿色常亮/绿色闪烁/灭

    黄色常亮

    表示硬盘故障

    登录iMana 200/iBMC且使用FusionServer Tools Toolkit工具检查硬盘是否存在故障。

    表示硬盘不在位或硬盘故障

    请检查硬盘是否完全接触正常或登录iMana 200/iBMC且使用FusionServer Tools Toolkit工具检查硬盘是否存在故障。

    说明:

    仅高密服务器、机架服务器的RH1288 V3、RH2288 V3、RH2288H V3、RH5288 V3、RH5885 V3、RH5885H V3和RH8100 V3、刀片服务器E9000的CH225 V3计算节点涉及NVMe PCIe 固态硬盘指示灯。

    表6-4 NVMe PCIe 固态硬盘指示灯

    NVMe硬盘Active指示灯

    NVMe硬盘Fault指示灯

    含义

    处理步骤及说明

    绿色常亮

    NVMe PCIe 固态硬盘在位且无故障。

    无需任何操作。

    绿色闪烁(2Hz)

    NVMe PCIe 固态硬盘正在进行读写操作。

    NVMe PCIe 固态硬盘不在位。

    绿色常亮/灭

    黄色常亮

    NVMe PCIe 固态硬盘故障。

    重新插拔后若问题仍未解决则更换NVMe PCIe 固态硬盘。

    黄色闪烁(2Hz)

    NVMe PCIe 固态硬盘正处于热插过程中。

    无需任何操作。

    黄色闪烁(0.5Hz)

    NVMe PCIe 固态硬盘已走完热拔出流程,允许拔出。

    拔出NVMe PCIe 固态硬盘。

    说明:

    若NVMe PCIe 固态硬盘插入后Fault指示灯黄色闪烁(0.5Hz),请重新插拔。

    表6-5 电源模块状态指示灯

    模块指示灯

    指示灯状态

    含义

    处理步骤及说明

    电源模块运行状态指示灯(460W/750W/800W/1200W)

    绿色常亮

    表示电源输入正常

    无需任何操作。

    表示无电源输入,或者系统处于Standby状态或异常状态

    请检查电源线是否连接正常或电源模块是否存在故障。

    电源模块运行状态指示灯(2000W/2500W/3000W)

    绿色常亮

    表示电源模块运行正常

    无需任何操作。

    绿色闪烁(2秒1次)

    表示电源模块处于休眠状态或电源未插稳

    请检查服务器是否启动休眠设置(仅限E9000产品),否则检查电源是否插稳。

    红色常亮

    表示电源模块运行异常

    1. 检查电源是否故障。
    2. 否则检查外部供电是否正常。

    表示无电源输入或处于异常状态

    请检查电源线是否连接正常。

    电源模块运行状态指示灯(500W/900W/1500W)

    绿色常亮

    表示电源模块运行正常

    无需任何操作。

    绿色闪烁(1秒1次)

    • 表示电源输入正常
    • 输入电压过高或过低

    说明:

    禁止对电源模块进行插拔等操作。

    检查外部供电是否正常。

    绿色闪烁(1秒4次)

    表示电源模块在线升级过程中

    无需任何操作。

    橙色常亮

    表示输入正常,电源过温保护、电源输出过流/短路、输出过压、短路保护以及器件失效(不包括所有的器件失效)等导致电源无输出

    将电源模块拔出,重新安装,检查问题是否解决,若仍橙色常亮,请更换电源模块。

    表示无电源输入或处于异常状态

    1. 检查电源是否故障。
    2. 否则检查外部供电是否正常。
    表6-6 网卡指示灯说明

    网卡类型

    芯片型号

    端口

    指示灯状态

    网络状态

    处理步骤

    • SM211(2*GE)电口灵活网卡
    • SM212(4*GE)电口灵活网卡插卡

    i350

    Active

    黄色闪烁

    网络有数据传输

    无需任何操作。

    网络无数据传输

    1. 交叉检查交换机和网线是否正常。
    2. 检查网卡状态是否正常。

    Link

    绿色常亮

    网络正常连接

    无需任何操作。

    无网络连接

    1. 交叉检查交换机和网线是否正常。
    2. 检查网卡状态是否正常。

    SM231(2*10GE)光口灵活网卡插卡

    82599

    Active

    黄色(常亮)

    网络无数据传输

    无需任何操作。

    黄色(闪烁)

    网络有数据传输

    Link

    绿色(常亮)

    网络正常连接

    绿色(闪烁)

    无网络连接

    1. 交叉检查交换机和网线是否正常。
    2. 检查网卡状态是否正常。

    SM233(2*10GE)电口灵活网卡插卡

    X540

    Link Speed

    绿色常亮

    高速率(10Gb/s)

    无需任何操作。

    黄色常亮

    低速率(1Gb/s)

    1. 交叉检查交换机和网线是否正常。
    2. 检查网卡状态是否正常。

    无网络连接

    1. 交叉检查交换机和网线是否正常。
    2. 检查网卡状态是否正常。

    Link/Active

    绿色(常亮)

    网络无数据传输

    无需任何操作。

    绿色(闪烁)

    网络有数据传输

    无网络连接

    1. 交叉检查交换机和网线是否正常。
    2. 检查网卡状态是否正常。
    • SM251(1*56G)IB光口灵活网卡插卡
    • SM252(2*56G)IB光口灵活网卡插卡

    CX3

    Active

    绿色(常亮)

    网络正常连接

    无需任何操作。

    绿色(闪烁)

    网络异常连接

    1. 交叉检查交换机和网线是否正常。
    2. 检查网卡状态是否正常。

    无网络连接

    Link

    黄色(常亮)

    网络无数据传输

    无需任何操作。

    黄色(闪烁)

    网络有数据传输

    无网络连接

    1. 交叉检查交换机和网线是否正常。
    2. 检查网卡状态是否正常。
    说明:

    其它标准PCIe插卡的状态指示灯说明请参考对应厂家的官网链接资料。

仅RH5885 V2、RH5885 V3和RH5885H V3涉及的指示灯

表6-7 模块指示灯(适用于RH5885 V2、RH5885 V3和RH5885H V3)

模块指示灯

指示灯状态

含义

处理步骤及说明

内存模块电源指示灯

绿色常亮

表示内存模块已上电

无需任何操作。

表示内存模块未上电

内存模块故障指示灯

红色常亮

表示内存模块上存在内存故障。

根据内存条故障指示灯,更换对应的故障内存条。

表示内存模块上内存正常

无需任何操作。

内存条故障定位指示灯

红色常亮

表示对应内存故障

拆下内存模块,长按此内存故障定位按钮,此时,存在故障的内存对应的指示灯变亮。

表示对应内存正常

无需任何操作。

内存模块镜像指示灯(仅限RH5885H V3产品)

绿色常亮

表示内存模块已配置内存镜像

无需任何操作。

表示内存模块未配置内存镜像

热插拔PCIe卡状态指示灯

黄色常亮

表示PCIe卡异常或设备处于POST阶段

如非POST阶段显示黄色常亮告警,建议检查更换PCIe卡。

表示PCIe卡正常运行

无需任何操作。

热插拔PCIe卡电源指示灯

绿色常亮

表示PCIe卡电源正常

无需任何操作。

绿色闪烁

表示PCIe卡处于上电或下电过程中

表示PCIe卡已下电

RH5885 V2服务器诊断面板

绿色常亮

表示对应部件有异常告警

具体请参见《RH5885 V2 服务器 (8路) V100R001C02 用户指南》 2.5.1 前面板组件和2.5.2 指示灯和按钮 章节。

表示对应部件正常

无需任何操作。

RH5885 V3服务器故障诊断面板

红色常亮

表示对应部件有异常告警

具体请参见《RH5885 V3 服务器 V100R003 用户指南》 2.4 指示灯和按钮 章节。

表示对应部件正常

无需任何操作。

仅RH8100和X6800涉及的指示灯

表6-8 模块指示灯(适用于RH8100和X6800)

模块指示灯

指示灯状态

含义

处理步骤及说明

RH8100 V3风扇指示灯

绿色常亮

表示风扇框单板/模块硬件故障或者风扇模块软件处于在线升级状态(在线升级大约需要3分钟)

检查软件是否正在升级或风扇框单板/模块硬件是否故障。

绿色闪烁(2秒1次)

表示风扇模块与iBMC通信正常

无需任何操作。

绿色闪烁(1秒4次)

表示风扇模块与iBMC通信丢失

登录iBMC查看iBMC软件是否正常。

  • 如果iBMC软件异常,升级iBMC软件或者更换HFC,具体升级软件包下载请参见升级
  • 如果iBMC软件正常,重新插拔风扇模块,若告警未恢复,请更换风扇模块。

红色常亮

表示风扇框单板/模块硬件故障

重新插拔风扇模块,若告警未消除,请更换风扇模块。

红色闪烁

表示风扇模块有告警或风扇框单板/模块硬件可能故障

重新插拔风扇模块,若告警未消除,请更换风扇模块。

表示风扇模块未上电

无需任何操作。

X6800风扇模块运行状态指示灯

绿色常亮

表示风扇模块工作正常

无需任何操作。

红色常亮

表示风扇模块存在故障

请更换对应告警风扇模块。

表示风扇模块无电源输入

检查风扇模块是否插好。

内存模块按钮/状态指示灯

绿色常亮

表示内存模块工作正常

无需任何操作。

绿色闪烁

表示内存模块热插拔的一个中间状态

红色闪烁(1秒1次)

表示内存模块工作故障

查看iBMC事件告警日志,检查内存模块是否故障。

红色闪烁(1秒5次)

表示内存模块未插稳

检查内存模块是否插好。

表示内存模块未上电

内存模块ATTN指示灯

黄色常亮

表示操作热添加或者热移除的操作失败

首先确认客户业务是否能够迁移业务或停机。待停机后,对服务器进行先下电再上电操作。

  • 如果指示灯正常,再次尝试热迁移,若热迁移失败,请更换内存模块和内存条。
  • 如果指示灯仍黄色常亮,请直接更换内存模块和内存条。

黄色闪烁

在内存模块热添加过程中,用闪烁来提示用户是否需要取消当前操作,如果取消则需要在5s内再按一次内存模块按钮

无需任何操作。

表示操作正常

内存模块备用指示灯

绿色常亮

表示该内存模块处于空闲状态

无需任何操作。

该内存模块没有处于空闲状态

内存模块镜像指示灯

绿色常亮

表示内存模块已配置内存镜像

无需任何操作。

表示内存模块未配置内存镜像

计算模块状态指示灯

绿色常亮

表示计算模块工作正常

无需任何操作。

红色闪烁(1秒1次)

表示计算模块故障

查看iBMC事件告警日志,检查计算模块是否故障。

红色闪烁(1秒5次)

表示计算模块未插稳

检查计算模块是否插好。

计算模块未上电

仅E9000涉及的指示灯

表6-9 MM910管理模块指示灯

模块指示灯

指示灯状态

含义

处理步骤及说明

MM910管理模块电源指示灯(PWR)

绿色常亮

表示MM910已上电

无需任何操作。

绿色闪烁

表示MM910正在上电

表示MM910未上电

请检查MM910是否插好。

MM910管理模块健康状态指示灯(HLY)

绿色常亮

表示机箱各部件均工作正常

无需任何操作。

红色闪烁(1秒1次)

表示机箱某部件产生严重告警,此时主、备MM910均亮红灯

请检查MM910是否插好,登录HMM Web界面查看告警。

红色闪烁(1秒4次)

表示机箱某部件产生致命告警,此时主、备MM910均亮红灯

红色闪烁(1秒5次)

表示MM910松动

表示MM910未上电或正在上电

无需任何操作。

MM910管理模块主备状态指示灯(ACT)

绿色常亮

表示该MM910为主用状态

无需任何操作。

表示该MM910为备用状态

表6-10 E9000风扇模块指示灯

模块指示灯

指示灯状态

含义

处理步骤及说明

E9000风扇模块运行状态指示灯

绿色闪烁(2秒1次)

表示风扇模块工作正常

无需任何操作。

绿色闪烁(1秒4次)

表示风扇模块与MM910通信异常,无风扇告警。

交叉对换风扇模块,排查风扇模块是否故障或槽位异常。

红色闪烁(2秒1次)

表示风扇模块存在告警

  1. 登录HMM Web界面,查看风扇告警信息。
  2. 检查风扇模块电源接口是否接好或更换风扇模块。

表示风扇模块无电源输入

检查风扇模块是否插好或风扇模块的控制线路是否故障。

表6-11 E9000交换模块指示灯

模块指示灯

指示灯状态

含义

处理步骤及说明

堆叠状态指示灯(STAT)

绿色常亮

对于支持堆叠的交换模块:表示交换模块工作在堆叠主用状态或者未堆叠,且工作正常

无需任何操作。

对于不支持堆叠的交换模块:表示交换模块工作正常

绿色闪烁

对于支持堆叠的交换模块:表示交换模块工作在堆叠备用或者堆叠从状态,且工作正常

对于不支持堆叠的交换模块:表示交换模块正在上电

表示交换模块未上电

健康状态指示灯(HLY)

绿色常亮

表示交换模块工作正常

无需任何操作。

红色闪烁

表示交换模块产生异常告警或者未插稳

登录HMM Web界面检查事件告警日志,检查交换模块是否插稳或是否存在故障。

表示交换模块未上电

无需任何操作。

GE电口指示灯

绿色(常亮)

表示网络连接正常

无需任何操作。

绿色(闪烁)

表示当前有数据正在传输

表示当前无数据传输或网络未连接

  1. 交叉检查交换机、光纤、光模块(类型、速率是否匹配)是否正常。
  2. 检查操作系统网卡状态是否正常。
  3. 检查交换机和网卡端口是否UP。
  • 10GE光口连接状态指示灯
  • 25GE光口连接状态指示灯

绿色常亮

表示接口连接正常

无需任何操作。

表示接口连接异常

  1. 交叉检查交换机、光纤、光模块(类型、速率是否匹配)是否正常。
  2. 检查操作系统网卡状态是否正常。
  3. 检查交换机和网卡端口是否UP。
  • 10GE光口数据传输状态指示灯
  • 25GE光口数据传输状态指示灯

橙色闪烁

表示接口正在发送或接收数据

无需任何操作。

表示接口无数据传输

40GE光口指示灯

绿色(常亮)

表示网络连接正常

无需任何操作。

绿色(闪烁)

表示当前有数据正在传输

表示当前无数据传输或网络未连接

  1. 交叉检查交换机、光纤、光模块(类型、速率是否匹配)是否正常。
  2. 检查操作系统网卡状态是否正常。
  3. 检查交换机和网卡端口是否UP。
  • 8G FC光口连接诊断状态指示灯
  • 16G FC光口连接诊断状态指示灯

橙色常亮

表示交换模块与对端设备的端口不同步

检查网线是否连接正常,检查光模块和网卡是否存在故障。

橙色闪烁(2秒1次)

表示端口关闭

橙色闪烁(1秒2次)

表示端口故障

连接状态指示灯同时灭,表示光模块没有插入或接收光异常。

  • 8G FC光口连接状态指示灯
  • 16G FC光口连接状态指示灯

绿色常亮

表示端口正常,链路已连接

无需任何操作。

绿色闪烁(2秒1次)

表示端口正常但被隔离,未建立链路连接

如果对端是交换机,请检查交换机之间的工作模式是否匹配,具体可参见《E9000 服务器 V100R001 开局指导书》。如果对端是存储设备,请检查存储端口。

绿色闪烁(1秒2次)

表示端口内环回(诊断模式)

无需任何操作。

绿色闪烁(1秒4次)

表示链路已连接且有数据传输

诊断状态指示灯同时灭,表示光模块没有插入或接收光异常

请检查光模块是否插入或故障,光纤是否故障。

CX911 8G FC光口数据传输状态指示灯

橙色闪烁(1秒2次)

连接状态指示灯同时绿色闪烁,表示超温告警

查看iMana 200/iBMC事件告警日志,检查是否有高温告警。

橙色闪烁(>1秒2次)

表示端口正在发送或接收数据

无需任何操作。

表示端口无数据传输

CX911 8G FC光口连接状态指示灯

绿色常亮

表示链路连接正常

无需任何操作。

绿色闪烁(1秒1次)

表示设备正在注册或端口处于诊断状态

绿色闪烁(1秒2次)

表示链路连接异常或端口故障;如果数据传输状态指示灯为橙色灯同时2闪/秒,表示超温告警

请检查端口、光模块和光纤是否故障。

表示光模块没有插入或接收光异常

请检查光模块和光纤是否故障。

  • IB光口状态指示灯
  • OPA接口状态指示灯

绿色常亮

表示端口连接正常

无需任何操作。

绿色闪烁

表示端口正在发送或接收数据

表示端口未连接

下载文档
更新时间:2019-01-23

文档编号:EDOC1000086281

浏览量:92912

下载量:37452

平均得分:
本文档适用于这些产品
相关文档
相关版本
分享
上一页 下一页