CANN/ge LLM-DataDist初始化API-尧图建网站

# Initialize【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge产品支持情况Atlas A3 训练系列产品/Atlas A3 推理系列产品支持Atlas A2 推理系列产品支持Atlas A2 训练系列产品不支持函数功能初始化LLM-DataDist。函数原型Status Initialize(const std::mapAscendString, AscendString options)参数说明参数名输入/输出描述options输入初始化参数值。具体请参考表1。表 1options参数名可选/必选描述OPTION_LISTEN_IP_INFOPormpt必选表示Device侧的IP地址和端口。配置示例如192.168.1.1:26000单进程多卡场景传入多个时使用英文分号分割。OPTION_DEVICE_ID必选设置当前进程的Device ID如0单进程多卡场景传入多个时使用英文分号分割。OPTION_SYNC_CACHE_WAIT_TIME可选kv相关操作的超时时间单位ms。不配置默认为1000ms。相关接口如下。- AllocateCache- DeallocateCache- PullKvCache- PullKvBlocks- CopyKvCache- CopyKvBlocks- PushKvCache- PushKvBlocksOPTION_BUF_POOL_CFG可选配置内存池大小与档位信息提高内存申请性能和使用率。格式为json string字段含义见表2使用示例如下所示。{buf_cfg:[{total_size:2097152,blk_size:256,max_buf_size:8192}],buf_pool_size: 2147483648}OPTION_ENABLE_SET_ROLE可选配置是否支持角色平滑切换。取值如下。- 1支持。- 0不支持不配置默认为不支持。相关接口SetRole。表 2OPTION_BUF_POOL_CFG配置配置项可选/必选描述buf_cfg可选内存池档位配置详见表3。buf_pool_size可选内存池大小单位为byte。表 3buf_cfg配置配置项可选/必选描述total_size必选当前档位内存池的大小单位byte。说明 total_size是2M的倍数且total_size是blk_size的倍数最大值不应超过0xFFFFFFFF。blk_size必选当前档位一次可以申请的最小内存值单位byte。说明要求满足2^n且在(0,2M]之间小于或等于max_buf_size。max_buf_size必选当前档位一次可以申请的最大内存值单位byte。说明小于total_sizemax_buf_size必须保持严格递增。返回值LLM_SUCCESS成功LLM_PARAM_INVALID参数错误其他失败异常处理无约束说明需要和Finalize配对使用初始化成功后任何退出前都需要调用Finalize保证资源释放否则会出现资源释放顺序不符合预期而导致问题。【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

相关新闻

StudioPlugins完整教程：从零开始配置你的Android Studio开发环境

如何永久保存微信聊天记忆？WeChatMsg聊天记录导出与智能分析终极指南

httpcache核心组件解析：深入理解Transport和Cache接口

最新新闻

PCB布局布线中的电平匹配关键技术与设计规范

MCPJungle高级功能：状态会话管理与连接优化技巧

ChatGPT Pro深度评测：128K上下文与多模态能力如何重构专业工作流

2023最新Python-Backdoor安装指南：从克隆到配置的完整步骤

NixOps4完全指南：如何用Nix声明式管理资源与部署

CANN/cannbot-skills Pytest生成器执行总纲

日新闻

SSRF漏洞攻防实战：从原理到绕过技巧与防御策略

Playwright自动化测试实战：从零搭建现代Web测试框架

Zip炸弹漏洞剖析：从GuardDog安全工具瘫痪看文件解压的资源耗尽攻击与防御

周新闻

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

月新闻

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！