CANN/ge LLMDataDist switch_role API指南
# switch_role【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge产品支持情况Atlas A3 训练系列产品/Atlas A3 推理系列产品支持Atlas A2 推理系列产品支持Atlas A2 训练系列产品不支持函数功能切换当前LLMDataDist的角色建议仅在使用PagedAttention的场景使用。函数原型switch_role(self, role: LLMRole, switch_options: Optional[Dict[str, str]] None)参数说明参数名称数据类型取值说明roleLLMRole切换的目标角色。switch_optionsoptions: Dict[str, str]切换角色配置项。可选参数默认值为None。切换为Prompt时需要设置其中需包含listen_ip_info配置项。调用示例from llm_datadist import LLMDataDist, LLMRole llm_datadist LLMDataDist(LLMRole.DECODER, 0) ... switch_options { llm.listenIpInfo: 127.0.0.1:26000 } llm_datadist.switch_role(LLMRole.PROMPT, switch_options)返回值正常情况下无返回值。传入数据类型错误情况下会抛出TypeError或ValueError异常。如果初始化LLMDataDist时LLMConfig未使能enable_switch_role调用该接口则会抛出LLMExceptionstatus_code为LLM_FEATURE_NOT_ENABLED。如果switch_role时存在残留链路资源则会抛出LLMExceptionstatus_code为LLM_EXIST_LINK。如果switch_role的目标role与当前role相同则会抛出LLMExceptionstatus_code为LLM_PARAM_INVALID。单进程多卡模式下不支持调用该接口。约束说明无【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考