CANN异常算子Dump场景
ASCEND_DUMP_SCENE【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs功能描述在复现问题场景时使用该环境变量开启异常算子Dump导出异常算子的输入输出数据、workspace信息和Tiling信息。支持如下取值aic_err_brief_dump表示轻量化exception dump用于导出AI Core错误算子的输入输出、workspace数据。aic_err_norm_dump表示普通exception dump在轻量化exception dump基础上还会导出Shape、Data Type、Format以及属性信息。aic_err_detail_dump在轻量化exception dump基础上还会导出AI Core的内部存储、寄存器以及调用栈信息。配置该选项时有以下注意事项该选项仅支持以下型号Atlas A2 训练系列产品/Atlas A2 推理系列产品Atlas A3 训练系列产品/Atlas A3 推理系列产品导出dump文件过程中会暂停问题算子所在的AI Core因此可能会影响Device上其他业务进程的正常执行导出dump文件后会自行恢复AI Core。导出dump文件后会强制退出Host侧用户业务进程强制退出过程中的报错可不作为AI Core问题分析的输入。配置aic_err_detail_dump选项后如果生成了dump文件但不是*.core文件则表示aic_err_detail_dump对应的功能没有启动成功系统自动切换为按aic_err_brief_dump选项进行dump。配置示例export ASCEND_DUMP_SCENEaic_err_brief_dump使用约束开启异常算子Dump功能有多种方式优先级从高到低依次为ASCEND_DUMP_SCENE环境变量 NPU_COLLECT_PATH环境变量 配置文件aclInit接口、aclmdlSetDump接口。通过此环境变量导出的dump信息存储路径优先级从高到低依次为ASCEND_DUMP_PATH环境变量 ASCEND_WORK_PATH环境变量 默认路径应用程序的当前执行目录。支持的型号Atlas 训练系列产品Atlas 推理系列产品Atlas A2 训练系列产品/Atlas A2 推理系列产品Atlas A3 训练系列产品/Atlas A3 推理系列产品Ascend 950PR/Ascend 950DTAtlas 200I/500 A2 推理产品IPV350【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考