CANN/asc-devkit Conv3D IterateAll接口-尧图建网站

IterateAll【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况Ascend 950PR/Ascend 950DT不支持Atlas A3 训练系列产品/Atlas A3 推理系列产品支持Atlas A2 训练系列产品/Atlas A2 推理系列产品支持Atlas 200I/500 A2 推理产品不支持Atlas 推理系列产品AI Core不支持Atlas 推理系列产品Vector Core不支持Atlas 训练系列产品不支持功能说明通过设置结果矩阵Output在GM上的首地址本接口一次性计算singleCo * singleDo * singleM大小的数据块并写到结果矩阵Output中。本接口提供单核内卷积计算能力singleCo为多核切分后单个核内的输出通道大小singleDo为多核切分后单个核内的Dout大小singleM为多核切分后单个核内的M大小。singleCo、singleDo和singleM的大小通过SetSingleOutputShape接口设置。函数原型__aicore__ inline void IterateAll(const AscendC::GlobalTensorOutputT output, bool enPartialSum false)参数说明参数名输入/输出描述output输入Output在GM上的地址。类型为GlobalTensor。结果矩阵Output支持的数据类型为half、bfloat16_t。enPartialSum输入预留参数。返回值说明无约束说明IterateAll接口仅支持处理单batch数据在多batch计算场景中需要通过batch次循环调用IterateAll接口完成计算。for (uint64_t batchIter 0; batchIter singleCoreBatch; batchIter) { conv3dApi.SetInput(inputGm[batchIter * inputOneBatchSize]); conv3dApi.IterateAll(outputGm[batchIter * outputOneBatchSize]); conv3dApi.End(); }IterateAll接口必须在初始化接口及输入输出配置接口之后进行调用完成Conv3D计算调用顺序如下。Init(...); ... // 输入输出配置 IterateAll(...); End();调用示例TPipe pipe; conv3dApi.Init(tiling); conv3dApi.SetWeight(weightGm); if (biasFlag) { conv3dApi.SetBias(biasGm); } conv3dApi.SetInputStartPosition(diIdxStart, mIdxStart); conv3dApi.SetSingleOutputShape(singleCoreCout, singleCoreDout, singleCoreM); for (uint64_t batchIter 0; batchIter singleCoreBatch; batchIter) { conv3dApi.SetInput(inputGm[batchIter * inputOneBatchSize]); conv3dApi.IterateAll(outputGm[batchIter * outputOneBatchSize]); conv3dApi.End(); }【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

相关新闻

Windows用户如何免费获得苹果苹方字体体验？3分钟快速安装终极指南

终极指南：如何用Video2X将模糊视频智能修复到4K高清画质

如何使用gh-markdown-preview：3分钟快速上手GitHub风格Markdown预览终极指南

最新新闻

CANN/mat-chem-sim-pred SOPDT批处理滚动评分

electron-redux高级技巧：createAliasedAction实现复杂业务逻辑的优雅方案

最新版权清晰 AI音乐写歌工具软件App推荐 商用全场景实测指南

jqjq管道运算符深度解析：数据流处理的核心机制

Panel Colorizer与Plasma Manager集成：NixOS环境下的最佳实践

10分钟上手electron-prebuilt：快速安装与使用教程

日新闻

SSRF漏洞攻防实战：从原理到绕过技巧与防御策略

Playwright自动化测试实战：从零搭建现代Web测试框架

Zip炸弹漏洞剖析：从GuardDog安全工具瘫痪看文件解压的资源耗尽攻击与防御

周新闻

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

月新闻

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

最新版权清晰 AI音乐写歌工具软件App推荐商用全场景实测指南