CANN/ge LLM数据分发缓冲区池配置
# buf_pool_cfg【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge产品支持情况Atlas A3 训练系列产品/Atlas A3 推理系列产品支持Atlas A2 推理系列产品支持Atlas A2 训练系列产品不支持函数功能用户指定内存档位配置提高内存申请性能和使用率。函数原型buf_pool_cfg(buf_pool_cfg)参数说明参数名称数据类型取值说明buf_pool_cfgstringjson数组格式字符串包含total_size blk_size和max_buf_size三个节点配置项可选/必选描述total_size必选当前档位内存池的大小单位Byte约束total_size是2M的倍数且total_size是blk_size的倍数最大值不应超过0xFFFFFFFF。blk_size必选当前档位一次可以申请的最小内存值单位Byte约束要求满足2^n且在(0,2M]之间小于或等于max_buf_sizemax_buf_size必选当前档位一次可以申请的最大内存值单位Byte约束小于total_size。如果设置有多个档位按照档位出现的先后顺序max_buf_size必须保持严格递增。调用示例from llm_datadist import LLMConfig llm_config LLMConfig() llm_config.buf_pool_cfg {buf_cfg: [{total_size:2097152,blk_size:256,max_buf_size:8192},{total_size: 10485760,blk_size: 8192,max_buf_size: 8388608},{total_size: 69206016,blk_size: 8192,max_buf_size: 67108864}]}返回值正常情况下无返回值。参数错误可能抛出TypeError或ValueError。约束说明无【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考