迁移归档总结Summary【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills【最终交付物】步 6 归档完成后以本文件作为迁移结论的唯一对外交付文档。数据来源于working/下过程记录Mig_report.md、Compare.md、Mig_Readme.md、environment.md归档前须与 workflow.md「文档一致性校验矩阵」核对。必填文首「当前进程与适配状态显式快照」成功路径须写清baseline 来源项目训练日志 / GPU 实测及选用原因。1. 归档元信息字段内容项目名称 / 仓库归档日期负责人关联分支 / Tag关联文档Mig_report.md/Mig_Readme.md/Compare.md/mig_docs/working/environment.md当前进程与适配状态显式快照本块为归档时的对外可读状态栏读者应不看正文即可判断「成了没有、在哪测的、和谁比的、卡在哪」。总览字段填写迁移/适配状态已成功适配 / 条件通过 / 适配失败 / 已暂停MANUAL_STOP/ 进行中择一一句话结论例如NPU 推理已达标或自定义算子未适配导致训练尚未跑通已成功适配时请与Compare.md、Mig_Readme.md§3.1 对齐字段填写本次性能对比实际采用的 baseline项目训练日志写路径/GPU 实测/N/A选用原因必填项目已有完整训练日志直接引用无需重跑 /无完整日志默认 GPU经 §2.6 用户自测 /其他须一句话说明性能测试环境机器/板卡、OS、CANN、驱动、框架 Ascend 插件、沙箱内/外采信结论性能测试数据集名称、版本、子集/规模对应Mig_Readme表中哪一行短测/冒烟/全量等性能结论摘要p50/p95、吞吐相对 baseline 是提升/回退是否达项目 KPI精度测试环境若与性能不同请单独写相同可写「同上」精度测试数据集名称、版本、划分与基线是否同一套数据精度结论摘要指标名与数值、阈值、是否达标适配失败或受阻时勾选适用项并写关键证据NPU 算子不支持 / 缺失日志中的算子或子图名NPU 运行时 / CANN / 驱动依赖缺失或版本不匹配NPU 运行/加载失败错误摘要精度不达标相对 baseline 或 Golden性能不达标相对 baselineMANUAL_STOP环境不可自动化见Mig_report手动需求清单其他自由补充当前阻塞与下一步一句人话 指向Mig_report§7 或相关章节2. 迁移操作总结2.1 关键步骤按时间线2.2 关键命令与产物类别关键命令或路径说明环境检测代码级迁移 / 启动命令推理测试训练测试若适用checkpoint / 配置 / 日志2.3 关键变更文件文件路径变更类型新增/修改/删除目的3. 迁移环境总结机器事实与 4.0.3 判定以working/environment.md为准落实目标见docs/environment-setup-objectives.md。本节为归档摘要须与快照一致。项值备注Ascend 型号驱动版本CANN 版本CANN / 框架 Ascend 插件版本Python / 关键依赖框架 Ascend 插件 / torch_npu 等沙箱检测策略沙箱内 / 沙箱外 / 两者最终采信环境采信原因4. 预判、门禁与迁移后验证总结阶段划分与 workflow「文档一致性校验矩阵」对齐§4.1 4.0.3 门禁part-03§4.2 预判与验证可行性预判 ←Mig_report§2.2part-02smoke / 训练短测 ←Mig_report§6part-0405§4.3 数据集与测试用途Mig_Readme§3.1。术语见 workflow.md。4.1 门禁与适配判定part-03 §4.04.0.3 判定AUTO / MANUAL_STOP / UNKNOWN判定依据摘要若 MANUAL_STOP手动需求清单执行状态4.2 代码级迁移可行性预判与验证part-02 迁移后风险项预判part-02实测结果处理结论迁移链路 / IO 契约算子/后处理动态 shape / batch迁移后 smokeMig_report§6摘要回填推理 smoke通过 / 未测 / 失败关键现象一句训练 smoke若适用通过 / 未测 / 失败Golden 样本一致性通过 / 未测 / 未达标训练短测若适用代码迁移后part-05 §8.1.1loss相对起点稳定下降约 30%50%即判通过并收口是否未做同配置多余重复是 / 否若否请说明4.3 数据集与测试用途摘要与 Mig_Readme 一致与Mig_Readme.md§3.1一致下载过程见§3.2数据路径与环境准备目标见docs/environment-setup-objectives.md及 part-07-commands.md。测试类型数据集名称/版本本地路径或DATA_ROOT短测冒烟Golden若单独全量精度/性能训练若适用推理验收下载方式摘要入口 命令行或浏览器步骤一句话详见Mig_Readme.md§3.25. 训练与推理效果总结5.1 推理效果推理 smokeGolden 样本一致性全量精度结论引用Compare.md性能结论p50/p95/吞吐5.2 训练效果若适用训练短测part-05 §8.1.1loss 相对起点降幅%、是否达约 30%50%且一次收口无重复训练 smoke单 batch/少量 steploss/梯度稳定性迭代策略与Mig_Readme§5.3 一致指标不明显时是否已适当加大 iteration若500或项目约定阈值仍无改善是否已转代码/模型实现排查及结论摘要checkpoint 可用性5.3 达标性结论维度是否达标结论说明精度是 / 否性能是 / 否训练可用性若适用是 / 否总体结论通过 / 条件通过 / 不通过6. 问题与风险收口与矩阵「失败/回滚」行对齐权威细节在Mig_report§7§8修复后须回写Compare.md。未解决问题已知风险与适用边界回滚点版本/命令/路径排查与修复摘要见Mig_report.md§7运行日志路径Mig_report§87. 下一步计划待办负责人截止时间状态8. 签署与交接技术负责人确认测试负责人确认运维/部署负责人确认交接备注【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考