CANN/docs AOE工具调优模型-尧图建网站

使用AOE工具调优模型【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs本节介绍推理场景下使用aoe命令进行子图调优、算子调优的基本方法。在调优前您需要先参见《AOE调优工具》准备好环境、了解使用约束以及基本的参数使用方法。使用aoe命令调优时会生成适配AI处理器的om模型文件、基于AI处理器的调优知识库、调优效果文件通过效果文件可查阅模型中各算子的性能提升率。由于生成om模型文件所以aoe命令是包含模型转换的功能因此aoe命令的参数一般来说是在atc命令参数的基础上增加了**--job_type参数增加子图调优**、算子调优的功能。一般建议先进行子图调优再进行算子调优原因是先进行子图调优会生成图的切分方式子图调优后算子已经被切分成最终的shape了再进行算子调优会基于这个最终shape去做算子调优。如果优先算子调优这时调优的算子shape不是最终切分后的算子shape可能会影响最终的调优效果。操作步骤使用aoe命令依次执行子图调优、算子调优。子图调优命令示例如下所示aoe --model${HOME}/module/resnet50_pytorch_1.4.onnx --framework5 --job_type1算子调优命令示例如下所示aoe --model${HOME}/module/resnet50_pytorch_1.4.onnx --framework5 --job_type2查看调优结果。执行调优结果如下所示代表调优完成并且性能有提升。调优后同时生成自定义知识库、om模型文件以及调优效果文件。xxxx process finished. Performance improved by xx% //xxxx调优任务名称,xx%性能提升的比例。调优结果文件如下基于AI处理器的调优知识库针对子图调优默认存储到${HOME}/Ascend/latest/data/aoe/custom/graph/${soc_version}目录下。针对算子调优默认存储到${HOME}/Ascend/latest/data/aoe/custom/op/${soc_version}路径下。适配AI处理器的om模型文件调优后的om模型默认存放在执行aoe命令的当前目录下具体路径如下${model_name}_${timestamp}/tunespace/result/${model_name}_${timestamp}_tune.om或者${model_name}_${timestamp}_tune___${os}_${arch}.om。调优效果文件执行aoe命令的当前目录下生成命名为“aoe_result_opat_{timestamp}_{pid_xxx_}.json”的文件记录调优过程中被调优的算子信息。json文件中的内容片段示例如下{ op_name: Conv_125, op_type: Conv2D, tune_performance: { Schedule: { performance_after_tune(us): 72.046, performance_before_tune(us): 72.055, performance_improvement: 0.01%, update_mode: add } } }指定调优知识库再执行模型推理。设置TUNE_BANK_PATH环境变量指定为AOE调优后的自定义知识库存放路径该路径下的graph目录下为子图调优知识库、op目录下为算子调优知识库。示例如下export TUNE_BANK_PATH/home/HwHiAiUser/custom模型推理。使用1中执行算子调优命令生成的om模型文件执行模型推理。说明支持“一次AOE调优多次ATC模型转换”的场景使用AOE工具调优模型后若由于其它业务需求需要重新转换模型可通过环境变量指定AOE调优知识库的路径再使用ATC工具重新转换模型这样就可以基于知识库中的调优策略编译模型、转换出调优后的模型。【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

相关新闻

STM32F745VG与LV30条码扫描器的工业级图像识别方案

FreeMoCap动作捕捉系统：免费开源的动作捕捉终极指南

GitHub Desktop中文版终极指南：一键实现中文界面，告别英文困扰

最新新闻

Selenium IDE插件开发实战：从零构建自定义测试命令

VGG-T3框架：实时大规模3D场景重建技术解析

YOLO26集成ARConv：自适应卷积核在目标检测中的应用

欧洲BXIv3高性能互连技术：突破AI与HPC网络瓶颈

DINOv3：自监督视觉基础模型的技术突破与应用

AD74413R与MK64FX512VDC12高精度工业控制方案解析

日新闻

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

周新闻

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

月新闻

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！