检查服务器
请按照如图5-31所示顺序检查服务器,采用的方式请根据实际情况确定。
操作过程中涉及的命令行的详细信息可参考《Atlas 800 推理服务器 iBMC 用户指南(型号 3000)》。
操作步骤
- 查看指示灯状态。
观察服务器的指示灯状态,确定设备硬件状态正常。
- 检查服务器。
- 通过iBMC WebUI检查服务器。
- 通过WebUI登录iBMC,详细信息请参见登录iBMC Web界面。
- 查询服务器固件版本信息,确保服务器的版本满足局点要求。
- 查询服务器健康状态。
- 若查询结果显示有告警,请参见《Atlas 800 推理服务器 iBMC 告警处理(型号 3000)》清除产生的告警。
- 通过iBMC命令行检查服务器。
- 在PC上配置与iBMC管理网口同一网段的IP地址。
- 使用网线将PC与服务器的iBMC管理网口相连。
- 在PC端打开命令行管理工具(如SSH、PuTTY),输入iBMC管理网口IP地址、用户名、密码,进入命令行。
iBMC默认支持SSH登录,如果已经设置为关闭,需要在Web界面的“服务管理 > 端口服务”页面中打开SSH服务并保存后才能通过SSH工具登录。
- 执行ipmcget -d ver命令,查询服务器的版本信息,确认服务器的版本满足局点要求。
iBMC:/->ipmcget -d ver ------------------- iBMC INFO ------------------- IPMC CPU: Hi1710 IPMI Version: 2.0 CPLD Version: (U6076)1.00 Active iBMC Version: (U68)3.32 Active iBMC Build: 003 Active iBMC Built: 14:32:33 Apr 15 2019 Backup iBMC Version: 3.32 SDK Version: 3.26 SDK Built: 10:53:30 Mar 18 2019 Active Uboot Version: 2.1.13 (Dec 24 2018 - 20:23:20) Backup Uboot Version: 2.1.13 (Dec 24 2018 - 20:23:20) ----------------- Product INFO ----------------- Product ID: 0x0001 Product Name: XXXX iME Version: 0.66 BIOS Version: (U75)0.90 -------------- Mother Board INFO --------------- Mainboard BoardID: 0x00b9 Mainboard PCB: .A --------------- Riser Card INFO ---------------- Riser1 BoardName: BC11PRUCRiser1 BoardID: 0x0090 Riser1 PCB: .A Riser2 BoardName: BC82PRNE Riser2 BoardID: 0x0032 Riser2 PCB: .A ------------------- HDD Backplane INFO ------------------- Disk BP1 BoardName: BC11THBQ Disk BP1 BoardID: 0x0073 Disk BP1 PCB: .A Disk BP1 CPLD Version:(U3)1.10 -------------------- IO Board INFO ------------------- IOBoard5 ProductName: BC82IOBA IOBoard5 BoardID: 0x0069 IOBoard5 PCB: .A IOBoard5 CPLD Version: (U12)0.01
- “CPLD Version”:服务器CPLD的版本号。
- “BIOS Version”:服务器BIOS的版本号。
- “Active iBMC Version”:服务器主工作区iBMC的版本号。
- “Backup iBMC Version”:服务器备工作区iBMC的版本号。
- 查询服务器的健康状态。
iBMC:/->ipmcget -d health System in health state.
- 如果查询结果为“System in health state”,则结束。
- 如果查询结果有告警信息,请执行后续步骤清除告警信息。
- 查询服务器的告警信息。
iBMC:/->ipmcget -d healthevents Event Num | Event Time | Alarm Level | Event Code | Event Description 1 | 2019-02-10 00:52:23 | Minor | 0x12000021 | get description failed. 2 | 2019-02-10 01:37:42 | Minor | 0x12000013 | Failed to obtain data of the air inlet temperature. 3 | 2019-02-10 00:52:23 | Minor | 0x12000019 | Right mounting ear is not present. 4 | 2019-02-10 00:52:19 | Major | 0x28000001 | The SAS or PCIe cable to front disk backplane is incorrectly connected.
- 参考《Atlas 800 推理服务器 iBMC 告警处理(型号 3000)》清除产生的告警。
- 通过iBMC WebUI检查服务器。