通过工具生成解析数据
设置环境变量
AI Core Error工具依赖于adc和cce,需要在模型转换执行服务器配置如下环境变量。
- adc环境变量
在命令行中执行如下命令配置adc环境变量,adc工具在toolkit安装路径下,需要根据实际安装路径配置。
export install_path=/home/HwHiAiUser/Ascend/ascend-toolkit/latest # 软件包安装路径,请根据实际修改 export PATH=${install_path}/toolkit/bin:$PATH
- cce环境变量
在命令行中执行如下命令配置cce环境变量,cce工具在atc安装路径下,需要根据实际安装路径配置。
export install_path=/home/HwHiAiUser/Ascend/ascend-toolkit/latest # 软件包安装路径,请根据实际修改 export PATH=${install_path}/atc/ccec_compiler/bin:${install_path}/atc/bin:$PATH
启动工具
参数 |
简写 |
是否必选 |
说明 |
---|---|---|---|
--remote_host |
-host |
远程必选 |
远程场景中推理执行的服务器IP和端口号,端口号默认为22118。 |
--compile_path |
-c |
必选 |
ATC执行模型转换的路径。 |
--output |
-out |
可选 |
AI Core Error生成的报告文件路径。不填写默认为当前路径。 |
- 远程场景中配置的compile_path会先在本地环境查找,未找到路径再去远程环境查找。
- 实际运行时请把remote_host中的IP地址(xx.xx.xx.xx)替换为实际IP地址。
进入脚本所在路径,通过命令行运行脚本启动AI Core Error分析工具,分为本地和远程两种场景。
脚本所在路径为“{toolkit包安装路径}/toolkit/tools/msaicerr”。
- 本地场景:
$ python3 msaicerr.pyc --compile_path /home/bl/Project/aicerror_data/compile_path_infer --output local_infer
- 远程场景:
$ python3 msaicerr.pyc --remote_host xx.xx.xx.xx:22118 --compile_path /home/gzj/app/model_convert
生成结果文件
AI Core Error Analyzer生成的文件会保存在--output参数指定路径下的“info_xxxx”文件夹中。
├── aicerror_xxxxx //AI Core Error分析工具生成文件 │ ├──info.txt //AI Core Error工具解析结果汇总文件 │ ├──te_transdata_xxxx.o │ ├──te_transdata_xxxx.o.txt //反编译文件 ├── collection //异常算子涉及文件 │ ├──compile │ ├──kernel_meta │ ├──cce文件 │ ├──json文件 │ ├──loc.json文件 │ ├──.o文件 │ ├──hisi_logs //黑匣子错误信息 │ ├──slog ├──error.log //收集了日志目录下所有ERROR级别日志信息 ├──imas.log //收集了GE的IMAS日志。