所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

华为服务器 故障处理 13

用于指导用户进行故障诊断和处理,以及日常的巡检工作。
评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
以太网控制器问题

以太网控制器问题

请根据以下故障现象进行诊断。

故障现象

处理步骤

快速恢复方法

网口不可见

  1. 排查网卡类型/驱动与OS/计算节点(BIOS/iMana 200/iBMC)是否符合兼容性要求:
    • 如果使用非兼容性列表中的系统,请联系具体OS研发解决。
    说明:

    建议使用兼容性列表中的系统。

    • 如果网卡版本不配套,请先升级。
  2. 收集日志。
  3. 在Linux系统中执行以下命令:lspci | grep -i eth*(请根据实际操作系统操作排查),排查网卡PCI硬件设备是否可见。
    • 如果PCI设备可见,参考5
    • 如果PCI设备不可见,参考4
  4. 如果PCI设备不可见,执行以下步骤:
    1. 查看网卡逻辑关系,如果没有CPU,对应CPU下PCI扣卡不可见。
    2. iMana 200/iBMC先下电再上电,确认问题是否必现。
    3. 对换不同槽位网卡,判断是否与具体网卡或网卡槽位相关。
  5. 如果PCI设备可见,但网口不可见,驱动加载失败导致,执行以下步骤:
    1. 在Linux系统中执行以下命令:ifconfig ethN up(请根据实际操作系统操作排查),排查网口配置文件和物理网口是否一致,是否up端口。
    2. 如果以编译方式安装驱动报错,请排查系统是否已正确安装GCC和C/C++。
    3. 排查光模块类型,Intel网卡配非Intel光模块时网口会加载失败,无法看到网口。
    4. 重新安装驱动,排查驱动安装过程是否有明显报错,系统日志是否有驱动加载失败打印。
  1. 如服务器正常运行过程中,原来可见的网口突然不可见,如果业务允许停机,则先下电后上电进行观察,若问题仍存在,执行2
  2. 将网卡更换到其他PCIe卡槽位进行观察。
  • 如果问题跟随网卡,则更换网卡。
  • 如果问题跟随PCI插槽,则更换主板。

网口不通

  1. 排查网线是否连接正常。
  2. 排查网卡类型/驱动与服务器单板(BIOS/iMana 200/iBMC)是否符合兼容性要求;网卡版本不配套,请先升级配套。
  3. 收集日志。
  4. 在Linux系统中执行以下命令:ifconfig ethN up,ethtool ethN(请根据实际操作系统操作排查),排查网卡是否up,且状态正常link,IP是否设置正确网口上。
  5. 在Linux系统中执行以下命令:ethtool -p(请根据实际操作系统操作排查),排查机架服务器网口配置文件和物理网口是否一致,网口状态灯亮,对端交换机网口up。
  6. 参考E9000刀片服务器 MEZZ卡-交换模块 组网助手排查交换板网口配置,两边网口需要up。
  7. 排查IP,网关,VLAN,bonding及上行交换机网口设置。
  1. 将异常服务器ping同网段其他IP,并检查同网段其他服务器是否存在网络异常:
    • 如果同网段多台服务器有问题,则检查外部交换网络是否异常。
    • 如果同网段只有一台服务器有问题,执行2检查网卡。
  2. 检查网卡网口状态(状态指示灯是否常亮),如果网口状态是link down(状态指示灯灭),将异常网口对应的光模块、光纤和上行交换机端口与正常网口对应部件进行互换,验证是否正常,根据实际情况更换或调整部件。
  3. 如果问题跟随网卡出现,请在业务允许停机的情况下重启网络服务,观察是否恢复正常;如果没有恢复正常,请先下电后上电观察是否解决,否则更换网卡。

网口丢包/错包

  1. 排查网卡类型/驱动与服务器单板(BIOS/iMana 200/iBMC)是否符合兼容性要求;如果网卡版本不配套,请先升级至配套版本。
  2. 收集日志。
  3. 排查网口丢包/错包统计是否持续增长,非持续增长的统计可不关注。
  4. 对换不同槽位网卡,排查是否与具体网卡或槽位相关。
  5. 排查机架服务器:不同服务器网口对调网线测试,是否和网线相关。
  6. 切换业务流量到其它单板网口,排查是否和流量有关。
  7. 在Linux系统中执行以下命令:ethtool -S ethN(请根据实际操作系统操作排查),排查网口丢包/错包具体项,根据对应项进一步排查。
  1. 排查是否单台服务器网卡丢包,执行ethtool -S命令查询丢包类型,执行top命令检查系统资源情况(如软中断、CPU和内存占用情况),检查网卡流量。
  2. 在业务允许停机的情况下,首先用PC直连网口,测试是否丢包;再和其他正常网口进行交叉验证,排查光模块、光纤线、上行交换机端口,根据实际情况更换或调整部件。
  3. 如果问题跟随网卡出现,请在业务允许停机的情况下重启网络服务,观察是否恢复正常;如果没有恢复正常,请先下电后上电观察是否解决,否则更换网卡。

网口性能不达标

  1. 排查网卡类型/驱动与服务器单板(BIOS/iMana 200/iBMC)是否符合兼容性要求;网卡版本不配套,请先升级配套。
  2. 收集日志。
  3. 排查物理网口是否达到性能要求。
  4. 排查是否修改过网口中断与CPU队列绑定关系。
  5. 在Linux系统中执行以下命令:ethtool -k ethN(请根据实际操作系统操作排查),排查是否修改过网口TSO,GSO设置。
  6. 在Linux系统中执行以下命令:ethtool -g ethN(请根据实际操作系统操作排查),排查是否修改过网口buffer。
下载文档
更新时间:2019-01-23

文档编号:EDOC1000086281

浏览量:88736

下载量:37277

平均得分:
本文档适用于这些产品
相关文档
相关版本
分享
上一页 下一页