分册 7命令模板【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills无主流程独立 §按需引用不阻塞主线。代码改动模式见 reference-code-patterns.md。说明昇腾运行时与torch_npu、MindSpore Ascend 等版本会随 CANN 变化。给出命令前先确认 CANN 与框架插件版本未确认项用占位符。science-model-npu-migration为代码级迁移 skill命令模板见下文。环境验证# 0) 若在沙箱中先做沙箱内检测失败再到沙箱外复检 # 以下命令在两侧保持一致便于对比 npu-smi info python --version python -c import torch; import torch_npu; print(torch.__version__); print(torch_npu ok) # MindSpore # python -c import mindspore as ms; print(ms.__version__)建议输出两组结果sandbox_in与sandbox_out并给出最终采信结论。注意IDE/CI受限会话或沙箱内npu-smi常失败须在本机终端沙箱外复检见 part-03-environment.md §4.0.1。CANN 环境加载Linux / bashsource /usr/local/Ascend/ascend-toolkit/set_env.sh # 或项目文档指定的 set_env 路径 export ASCEND_RT_VISIBLE_DEVICES0 npu-smi infoWindows / PowerShell# 路径以本机 CANN 安装为准 . C:\Program Files\Huawei\Ascend\ascend-toolkit\latest\set_env.ps1 $env:ASCEND_RT_VISIBLE_DEVICES 0 npu-smi info加载结果路径、是否成功写入mig_docs/working/environment.md的set_env与generated_at。环境准备目标与environment.md对齐目标条目见environment-setup-objectives.md门禁见 part-03-environment.md §4.0。数据路径Mig_Readme.md§3.1 / §3.2快照environment.md、Mig_report.md§2.1NPU 推理PyTorch torch_npusource /usr/local/Ascend/ascend-toolkit/set_env.sh export ASCEND_RT_VISIBLE_DEVICES0 python tools/infer.py \ --config configs/infer_npu.yaml \ --checkpoint path/to/weights \ --device npu:0 \ --input path/to/sample_or_list \ --batch-size N \ 21 | tee logs/infer_npu_smoke.logNPU 训练PyTorch 单卡source /usr/local/Ascend/ascend-toolkit/set_env.sh export ASCEND_RT_VISIBLE_DEVICES0 python tools/train.py \ --config configs/train_npu.yaml \ --device npu:0 \ --amp \ --max-steps N \ 21 | tee logs/train_npu_smoke.log多卡训练PyTorch HCCL示意source /usr/local/Ascend/ascend-toolkit/set_env.sh export ASCEND_RT_VISIBLE_DEVICES0,1,2,3 torchrun --nproc_per_node4 tools/train.py \ --config configs/train_npu.yaml \ --device npu \ --amp \ --max-steps N \ 21 | tee logs/train_npu_ddp.log脚本内须dist.init_process_group(backendhccl)且每 ranktorch.npu.set_device(local_rank)。详见 reference-code-patterns.md §4。MindSpore Ascendsource /usr/local/Ascend/ascend-toolkit/set_env.sh export ASCEND_RT_VISIBLE_DEVICES0 python train.py --device_target Ascend --device_id 0 --data_path path python eval.py --device_target Ascend --device_id 0 --checkpoint pathGolden 样本对比PyTorch示意# 固定输入分别跑 GPU baseline用户侧与 NPU对比输出 pkl/npy # 容差须按目标精度调整本 skill 默认 FP16勿套用 FP32 级阈值 python tools/export_golden.py --device npu:0 --input fixtures/golden_input.bin --out runs/npu_out.npy python tools/compare_golden.py --ref runs/gpu_out.npy --hyp runs/npu_out.npy --rtol 1e-2 --atol 1e-3容差与精度FP16 有效位约 3 位、最小正规数约 6e-5NPU 与 GPU 正常舍入差可超过 1e-5默认 FP16 路径建议--rtol 1e-2~1e-3、--atol 1e-3量级。FP32 可收紧至--rtol 1e-5~1e-4、--atol 1e-5~1e-6。须在Compare§3.1 写明所用阈值及目标精度。结果摘要写入Compare§3.1、Mig_report§6。性能 benchmark推理延迟/吞吐示意python tools/bench_infer.py \ --device npu:0 \ --batch-size 1,4,8 \ --warmup 50 \ --iters 200 \ --report-json runs/bench_npu.json口径须写入Compare§2.3warmup 次数、计时是否含 H2D、是否含后处理、batch、p50/p95 定义。失败日志留痕{ your_command_here; } 21 | tee logs/last_run_$(date %Y%m%d_%H%M%S).log失败/精度/性能异常时更新Mig_report§7、§8排查见 part-09-examples-troubleshooting.md。交叉引用精度/性能表填Compare.md§2.4§4。关联索引代码模式reference-code-patterns.md配合分册part-03 / part-04 / part-05失败留痕part-06、part-09流程总览workflow.md【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考