【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skillsname: science-model-npu-migration description: 面向华为 Ascend 的 NPU 代码级迁移环境门禁、脚本适配、精度/性能对比。Use when the user asks for NPU/Ascend migration, torch_npu, MindSpore Ascend, or NPU adaptation checks. argument-hint: [framework] [soc-or-chip] [FP16]NPU 迁移到昇腾Ascend技能标识science-model-npu-migration。本技能正文在references/分册中。执行时按 技能分册 顺序阅读流程总览见 workflow.md说明见 overview.md。何时使用触发词在以下表述时应选用本 skillNPU迁移、昇腾/Ascend、torch_npu、MindSpore Ascendskill 名称science-model-npu-migration及别名sci-model-npu-migration、sci_model-npu-migration「检测 NPU 适配情况」、代码适配、精度回归、延迟/吞吐评估等。适用边界适用不适用转专项 skill训练/推理代码从 CUDA、其他 GPU 栈或异构环境迁到昇腾模型已在 NPU 推理框架跑通且有基线仅需Decode 吞吐 / 延迟优化环境门禁、脚本与依赖适配、smoke、精度/性能对比归档仅做推理框架适配无完整代码级迁移链路→model-infer-migrator「检查 NPU 适配情况」快速路径part-03 门禁算子融合 / 图优化→model-infer-fusionKV Cache→model-infer-kvcache图模式→model-infer-graph-mode场景示例用户说「CUDA 上 PyTorch 训练仓库要迁到 910 并做精度性能对比」→本 skill用户说「NPU 上已跑通想优化 Decode 吞吐」→说明本 skill 不适用引导上述推理优化专项 skill。场景示例# 完整迁移 /science-model-npu-migration PyTorch 910 FP16 # 快速适配检查仅 part-03 门禁 检查当前工程对昇腾 NPU 的适配情况不做完整迁移资源端到端流程与闭环workflow.md含交付物映射、术语表、Mermaid、闭环检查清单交付模板deliverables-index.md环境与交付索引docs-index.md含环境目标与快照模板入口实战参考按需reference-code-patterns.md、part-07、part-09执行约定首条回复缺参必反问用户只说「迁到 NPU」「帮我迁移」等且未给出框架/芯片/精度时第一条可见回复必须是面向用户的文字——列出待确认的三项见 part-01「快速开始」或逐项反问禁止在未输出任何文字回复前仅调用 Read/工具读references/或静默探查工程。完整迁移顺序part-01 → 02 → 03 → 04 → 05 → 08不得跳过part-03§4.0再建议 NPU 训练/推理。参数调用如/science-model-npu-migration ...$ARGUMENTS[0]框架/工程栈、$ARGUMENTS[1]芯片/型号、$ARGUMENTS[2]精度默认 FP16缺参先问见上文第 0 条与 part-01。评测与归档先 part-05 落数再 part-08 同步文档并定稿mig_docs/Summary.md最终交付过程记录在working/。失败与回滚评测未通过或运行失败时走 part-06 part-09写入Mig_report§7按 workflow 回流 part-03 / 04 / 05。成功归档后 part-06 仅作可选风险复核。命令与排查part-07、part-09 按需引用不阻塞主线。快速检查仅「检查 NPU 适配情况」直接从 part-03 开始不进 part-0405 与完整归档。闭环与一致性每完成一个执行步按 workflow.md「闭环检查」更新对应落盘步 4 完成后核对 part-04§5.0 收口含§5.6 smoke步 5 末与步 6 归档前执行 workflow「文档一致性校验矩阵」确保environment.md、Mig_report、Mig_Readme、Compare、Summary关键字段无冲突。技能分册顺序文件内容1part-01-scope-and-baseline.md§1 信息收集、§2 基线2part-02-feasibility.md§3 可行性预判 →Mig_report§2.23part-03-environment.md§4 门禁与环境 →environment.md4part-04-code-migration.md§5 代码级迁移5part-05-performance-accuracy.md§7 性能、§8 精度6part-08-checklist-deliverables-output.md执行步 6Checklist、交付、归档无主流程 §—part-06-risk-rollback.md主流程 §9 回滚失败路径必用—part-07-commands.md命令模板按需无主流程 §—part-09-examples-troubleshooting.md示例与排查按需无主流程 §—reference-code-patterns.md代码模式与 CUDA→NPU 对照按需part 编号 ≠ 执行顺序执行步 6 为part-08part-06 为失败路径回滚。三套 § 对照见 workflow.md「三套编号对照」表。【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考