快照导出
快照日志存在以下导出方式:
- 被动导出
- Host设备管理驱动检测到Device设备启动异常后, 黑匣子会导出快照。
标志为:/var/log/npu/hisi_logs/device-x/history.log中记录有设备丢失异常(DEVICE_LTO_EXCEPTION)。
- Host设备管理驱动检测到Device设备心跳丢失异常后, 黑匣子会导出快照。
标志为:/var/log/npu/hisi_logs/device-x/history.log中记录有设备心跳异常(DEVICE_HBL_EXCEPTION)。
- Host设备管理驱动检测到Device设备启动异常后, 黑匣子会导出快照。
- 主动导出
设备热复位时,若快照数据中有异常信息,Device侧黑匣子会上报快照数据至Host侧,Host会解析数据成明文并落盘成文件。
标志为:/var/log/npu/hisi_logs/device-x/history.log中记录有启动异常(STARTUP_EXCEPTION)或运行异常(RUN_EXCEPTION)。
- 设备启动异常和心跳异常,为被动导出,不会存在实时的控制数据,需要热复位后填写。
- 快照导出的判定条件为:控制信息中error area count不为0,且控制信息队列中有flag=4。
- 快照上报为启动异常还是运行异常的判定条件为:热复位次数最小的异常。
- 日志记录在/var/log/npu/hisi_logs/device-0/<时间戳目录>/snapshot/hdr.log。