CANN/ge LLM-DataDist错误码-尧图建网站

# error-code【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/geerror-code是通过如下宏定义的。namespace llm_datadist { constexpr Status LLM_SUCCESS 0x0U; constexpr Status LLM_FAILED 0xFFFFFFFFU; constexpr Status LLM_WAIT_PROC_TIMEOUT 0x5010B001U; constexpr Status LLM_KV_CACHE_NOT_EXIST 0x5010B002U; constexpr Status LLM_PARAM_INVALID 0x5010B005U; constexpr Status LLM_NOT_YET_LINK 0x5010B007U; constexpr Status LLM_ALREADY_LINK 0x5010B008U; constexpr Status LLM_LINK_FAILED 0x5010B009U; constexpr Status LLM_UNLINK_FAILED 0x5010B00AU; constexpr Status LLM_NOTIFY_PROMPT_UNLINK_FAILED 0x5010B00BU; constexpr Status LLM_CLUSTER_NUM_EXCEED_LIMIT 0x5010B00CU; constexpr Status LLM_PROCESSING_LINK 0x5010B00DU; constexpr Status LLM_DEVICE_OUT_OF_MEMORY 0x5010B00EU; constexpr Status LLM_EXIST_LINK 0x5010B018U; constexpr Status LLM_FEATURE_NOT_ENABLED 0x5010B019U; constexpr Status LLM_TIMEOUT 0x5010B01AU; constexpr Status LLM_LINK_BUSY 0x5010B01BU; constexpr Status LLM_OUT_OF_MEMORY 0x5010B01CU; } // namespace llm_datadist具体error-code含义如下。枚举值含义是否可恢复解决办法LLM_SUCCESS成功无无LLM_FAILED通用失败否保留现场获取Host/Device日志并备份。LLM_WAIT_PROC_TIMEOUT处理超时是- 如果是PullKvCache、PullKvBlocks等传输相关接口报该错误该链路不可恢复需重新建链。- 其他接口报该异常加大超时时间并重试。LLM_KV_CACHE_NOT_EXISTKV不存在是- 检查cache_id是否正确。- 检查是否Cache已经释放。- 检查对应全量侧报错日志中的请求是否完成。- 检查是否存在重复拉取。LLM_PARAM_INVALID参数错误是基于日志排查错误原因。LLM_NOT_YET_LINK没有建链是上层排查Decode与Prompt建链情况。LLM_ALREADY_LINK重复建链是上层排查Decode与Prompt建链情况。LLM_LINK_FAILED建链失败是LinkLlmClusters第二个返回值中有该error-code时需要检查对应集群之间的网络连接。LLM_UNLINK_FAILED断链失败是UnlinkLlmClusters第二个返回值中有该error-code时需要检查对应集群之间的网络连接。LLM_NOTIFY_PROMPT_UNLINK_FAILED通知Prompt侧断链失败是1. 排查Decode与Prompt之间的网络连接。2. 主动调Prompt侧的UnlinkLlmClusters接口清理残留资源。LLM_CLUSTER_NUM_EXCEED_LIMIT集群数量超过限制是检查LinkLlmClusters和UnlinkLlmClusters传入参数clusters数量不能超过16。LLM_PROCESSING_LINK正在处理建链是当前正在执行建链或断链操作请稍后再试。LLM_DEVICE_OUT_OF_MEMORYDevice内存不足是检查申请的内存是否没有释放。LLM_EXIST_LINK设置角色时存在未释放的链接是检查在SetRole前是否已经调用UnlinkLlmClusters断开所有的链接。LLM_FEATURE_NOT_ENABLED特性未使能是检查初始化LLM-DataDist时是否传入了必要option。如果是SetRole时抛出该异常排查初始化时是否设置了OPTION_ENABLE_SET_ROLE 1LLM_TIMEOUT处理超时否保留现场获取Host/Device日志并备份。LLM_LINK_BUSY链路忙是预留error-code暂不会返回。LLM_OUT_OF_MEMORY内存不足是检查内存池或系统内存是否充足。【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

相关新闻

江苏省民营科技企业申报攻略指南及常见问题解答

《北京市企业技术中心梯度培育管理办法（试行）》政策解读

hashdeep实战案例：如何检测系统文件篡改和安全威胁

最新新闻

CANN/GE DFlow API MetaContext类

Bosca Ceoil Blue完整教程：从零开始制作专业级音乐

FastAPI-SQLAlchemy完整教程：掌握多数据库配置与连接管理

3分钟搞定空洞骑士模组：Scarab模组管理器终极指南

nwpu-cram高性能计算项目：西北工业大学并行矩阵运算终极指南 [特殊字符]

CANN/cann-recipes-train: Qwen3-30B-A3B SFT训练样例

日新闻

SSRF漏洞攻防实战：从原理到绕过技巧与防御策略

Playwright自动化测试实战：从零搭建现代Web测试框架

Zip炸弹漏洞剖析：从GuardDog安全工具瘫痪看文件解压的资源耗尽攻击与防御

周新闻

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

月新闻

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！