Atlas 300I 推理卡驱动升级后检查及版本紧急回退
本章节以Atlas 300I 推理卡(型号 3000)为例说明驱动升级后验证操作。rpm包的驱动升级功能不支持回退,如需回退需先删除驱动,再重新安装低版本驱动。
验证项目
固件升级后的验证项目如表5-2所示。
验证任务
验证步骤
使用root帐户登录Atlas 300I 推理卡(型号 3000)所在服务器。
- 执行npu-smi info查看驱动升级是否成功。如回显版本为升级目标版本则升级成功,否则升级失败,请联系华为工程师处理。
[root@localhost ~]# npu-smi info +------------------------------------------------------------------------------+ | npu-smi 1.2.2 Version: 1.3.5.B896 | +-------------------+-----------------+----------------------------------------+ | NPU Name | Health | Power(W) Temp(C) | | Chip | Bus-Id | AICore(%) Memory-Usage(MB) | +===================+=================+========================================+ | 133 310 | OK | 12.8 60 | | 0 | 0000:87:00.0 | 0 2375 / 8192 | +-------------------+-----------------+----------------------------------------+ | 133 310 | OK | 12.8 61 | | 1 | 0000:88:00.0 | 0 2375 / 8192 | +-------------------+-----------------+----------------------------------------+ | 133 310 | OK | 12.8 63 | | 2 | 0000:89:00.0 | 0 2375 / 8192 | +-------------------+-----------------+----------------------------------------+ | 133 310 | OK | 12.8 63 | | 3 | 0000:8A:00.0 | 0 2375 / 8192 | +===================+=================+========================================+
如果升级后无法登录host系统,请联系华为技术支持解决。
如果升级后不是目标版本或者升级失败,请重新进行升级。如果依然升级失败,请记录故障现象和操作步骤,并联系华为技术支持解决。