# Initialize【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge产品支持情况Atlas A3 训练系列产品/Atlas A3 推理系列产品支持Atlas A2 推理系列产品支持Atlas A2 训练系列产品不支持函数功能初始化LLM-DataDist。函数原型Status Initialize(const std::mapAscendString, AscendString options)参数说明参数名输入/输出描述options输入初始化参数值。具体请参考表1。表 1options参数名可选/必选描述OPTION_LISTEN_IP_INFOPormpt必选表示Device侧的IP地址和端口。配置示例如192.168.1.1:26000单进程多卡场景传入多个时使用英文分号分割。OPTION_DEVICE_ID必选设置当前进程的Device ID如0单进程多卡场景传入多个时使用英文分号分割。OPTION_SYNC_CACHE_WAIT_TIME可选kv相关操作的超时时间单位ms。不配置默认为1000ms。相关接口如下。- AllocateCache- DeallocateCache- PullKvCache- PullKvBlocks- CopyKvCache- CopyKvBlocks- PushKvCache- PushKvBlocksOPTION_BUF_POOL_CFG可选配置内存池大小与档位信息提高内存申请性能和使用率。格式为json string字段含义见表2使用示例如下所示。{buf_cfg:[{total_size:2097152,blk_size:256,max_buf_size:8192}],buf_pool_size: 2147483648}OPTION_ENABLE_SET_ROLE可选配置是否支持角色平滑切换。取值如下。- 1支持。- 0不支持不配置默认为不支持。相关接口SetRole。表 2OPTION_BUF_POOL_CFG配置配置项可选/必选描述buf_cfg可选内存池档位配置详见表3。buf_pool_size可选内存池大小单位为byte。表 3buf_cfg配置配置项可选/必选描述total_size必选当前档位内存池的大小单位byte。说明 total_size是2M的倍数且total_size是blk_size的倍数最大值不应超过0xFFFFFFFF。blk_size必选当前档位一次可以申请的最小内存值单位byte。说明 要求满足2^n且在(0,2M]之间小于或等于max_buf_size。max_buf_size必选当前档位一次可以申请的最大内存值单位byte。说明 小于total_sizemax_buf_size必须保持严格递增。返回值LLM_SUCCESS成功LLM_PARAM_INVALID参数错误其他失败异常处理无约束说明需要和Finalize配对使用初始化成功后任何退出前都需要调用Finalize保证资源释放否则会出现资源释放顺序不符合预期而导致问题。【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考