分册 1总述、信息收集、快速开始、成功标准与基线【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills对应主流程 §1§2。下一环节可行性预判见 part-02-feasibility.md环境门禁见 part-03-environment.md §4.0。端到端总述执行约定全文当用户要把“现有模型/推理链路迁移到 NPU昇腾/Ascend”时agent 应输出端到端迁移方案§1 信息收集与 §2 基线→§3 可行性预判part-02Mig_report§2.2→§4 环境与依赖门禁part-03 §4.0先mig_docs/working/environment.md再读 README/requirements 适配判定→§5 代码级迁移part-04→§7§8 精度/性能评测part-05Compare.md→归档与交付part-08定稿mig_docs/Summary.md失败/回滚走 part-06留痕Mig_report§7。 关键节点应给出命令模板按用户环境补齐参数发生失败或回退时须在Mig_report.md§7留痕现象、复现、根因、修复、验证并在§8注明运行日志路径。当用户通过参数调用本 skill例如/science-model-npu-migration ...时优先从输入中抽取$ARGUMENTS[0]框架/工程栈PyTorch/MindSpore/其他、$ARGUMENTS[1]目标芯片/型号如 310P/910 等、$ARGUMENTS[2]目标精度默认 FP16若缺少关键参数则按「快速开始参数最小集」先向用户输出文字反问框架/芯片/精度不得在未回复用户前仅读references/或工程文件确认后再进入信息收集与后续分册。1) 先收集关键信息缺什么就问什么缺参首条回复用户请求过于笼统如「帮我把模型迁到 NPU」时必须先输出可见文字列出或反问下列最小三项——框架/工程栈、目标芯片/型号、精度目标默认 FP16——再读分册或探查仓库。请优先向用户确认以下要点没有就让 agent 采用合理默认并在最后列出“仍需确认项”目标硬件Ascend 型号例如 310/310P/910 等、是否支持动态 shape软件栈版本驱动版本、CANN 版本、框架与 Ascend 插件版本至少能拿到npu-smi与关键包版本输出模型来源与工程结构框架PyTorch/MindSpore/其他、训练/推理入口脚本、输入/输出名称与 shape、是否含自定义算子或 CUDA 扩展精度与性能目标允许的精度下降范围、指标口径mAP/Top1/MAE 等、延迟/吞吐目标batch size、测量方式数据与数据集用途分别用于短测、冒烟、Golden若单独、全量精度/性能、训练、推理验收的数据集名称、版本、划分与样本规模是否与基线一致。训练向短测以loss约30%50%稳定下降为短测通过即停勿重复短测见 part-05-performance-accuracy.md §8.1.1非part-02 可行性预判数据获取各数据集的下载入口URL 或文档章节、下载过程浏览器或命令行步骤、校验方式可选、本地路径约定内网数据须写申请方式勿在文档中写密钥工程与依赖仓库中requirements.txt、environment.yml、setup.sh、Dockerfile 等基线推理入口脚本/命令Python 版本与关键库版本与基线一致基线素材检索项目内是否已有完整训练日志含指标、数据集、环境与 batch/超参等有则 §2 直接引用无则默认GPU baseline见 §2、Compare.md§2.1部署形态板卡/服务器、是否容器、推理服务框架StreamManager / 自研 C/Python / 其他安全与合规提醒用户不要在对话中粘贴密钥、内网地址、未脱敏的客户数据校准集与日志分享前做脱敏。快速开始参数最小集若用户希望尽快开工、尚未给出完整上下文至少补齐/确认以下 3 项参数对应$ARGUMENTS[0]$ARGUMENTS[2]再按完整迁移顺序从 part-01 起推进不得仅凭此 3 项跳过 part-02 预判或 part-03 §4.0 门禁直接进入代码级迁移part-04框架/工程栈PyTorch 或 MindSpore 等目标芯片/型号精度目标默认 FP162) 定义成功标准与基线防止“迁移后没人知道好不好”让 agent 输出一段“成功标准”并要求基线对齐基线来源按优先级项目内已有完整训练日志若仓库中已有可支撑与本次验收对齐的完整训练日志含关键指标如 loss/精度或延迟/吞吐、数据集或划分说明、环境与 batch/超参等可核对信息则直接引用该日志作为 baseline摘录填入Compare.md并注明日志路径无需重跑。否则性能对比默认 baseline 为 GPU由用户按Mig_Readme.md§2.6在 GPU 上补采agent 不代跑无可用 GPU 时在Compare.md填N/A并说明暂停误导性对比结论。明确基线环境设备、原推理/训练栈、版本、batch size与Compare.md§2.1、§4 口径一致。记录基线的精度与性能指标日志摘录或可复现输入明确回归判定规则例如精度不低于基线的 99%延迟提升不超过 X ms 等关联索引下一环节part-02-feasibility.md §3流程总览workflow.md 步 1落盘Compare.md§2.1规划Mig_Readme.md§3.1【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考