【实测】基于 K100-AI 部署 Hermes Agent 跑自主智能体操作指南-尧图建网站

一、项目概述本次测试目标是在海光 DCU K100-AI 环境中部署 Hermes Agent并接入本地大模型服务让 Hermes 以自主智能体方式完成复杂任务执行。本次主要验证场景为Hermes Agent 容器化部署接入本地 OpenAI Compatible API 模型服务安装并启用ppt-masterSkill通过 Hermes Agent 自动生成彩色 SVG PPT对比不同模型生成 18 页 PPT 的耗时和稳定测试中使用过两个模型模型节点用途Qwen3.5-122B-A10B-AWQ192.168.217.77测试Qwen3.6-27B-W8A8192.168.217.64测试Hermes Agent 部署在192.168.217.77节点模型服务通过 OpenAI 兼容接口调用。服务器配置项目规格CPU2×Hygon 7380 (32 Core, 2.2GHz)GPU8×海光 DCU K100-AI (64GB/卡)内存1024GB (16×64GB)系统盘2×480G SATA SSD数据盘2×3.2T SSD二、部署环境2.1 节点信息Hermes Agent 部署节点192.168.217.7727B 模型部署节点192.168.217.64Hermes 运行方式Docker 容器容器名称hermes-agentHermes Agent 版本v0.16.0三、Hermes Agent 容器部署3.1 容器目录规划Hermes Agent 采用容器部署并将关键目录挂载到宿主机方便后续保存配置、Skill、工作区和输出文件。目录映射关系如下宿主机目录容器内目录说明/data/hermes-deploy/home/root/.hermesHermes 配置、Skill、日志/data/hermes-deploy/workspace/workspace项目工作目录/data/hermes-deploy/output/output输出文件目录进入容器docker exec -it hermes-agent bash检查 Hermes 版本hermes --version四、配置模型服务Hermes 通过 OpenAI Compatible API 调用本地模型服务。配置文件路径/root/.hermes/config.yaml4.1 接入 122B 模型122B 模型服务位于 77 节点本机接口地址为http://127.0.0.1:8101/v1Hermes 配置示例model: provider: custom model: Qwen3.5-122B-A10B-AWQ base_url: http://127.0.0.1:8101/v1 api_key: none api_mode: chat_completions terminal: backend: local cwd: /workspace验证模型服务curl http://127.0.0.1:8101/v1/models4.2 接入 27B 模型27B 模型部署在192.168.217.64接口地址为http://192.168.217.64:8101/v1验证模型服务curl http://192.168.217.64:8101/v1/models返回示例{ id: Qwen3___6-27B-W8A8, max_model_len: 98304 }Hermes 配置示例model: provider: custom model: Qwen3___6-27B-W8A8 base_url: http://192.168.217.64:8101/v1 api_key: none api_mode: chat_completions context_length: 98304 max_tokens: 4096 terminal: backend: local cwd: /workspace auxiliary: compression: provider: custom model: Qwen3___6-27B-W8A8 base_url: http://192.168.217.64:8101/v1 api_key: none api_mode: chat_completions context_length: 98304 max_tokens: 2048这里需要注意context_length要和 vLLM 实际启动的--max-model-len对齐。Hermes 配置里写大并不会真正扩大模型上下文真正上下文大小取决于 vLLM 服务端。五、vLLM 启动注意事项Hermes Agent 会使用工具调用能力因此 vLLM 启动时必须开启自动工具调用。推荐参数--enable-auto-tool-choice --tool-call-parser qwen3_coder如果没有加这两个参数Hermes 调用模型时会报错auto tool choice requires --enable-auto-tool-choice and --tool-call-parser to be set27B 模型示例启动方式vllm serve /root/model/metax-tech/Qwen3.6-27B-W8A8 \ --host 0.0.0.0 \ --port 8101 \ --served-model-name Qwen3___6-27B-W8A8 \ --max-model-len 98304 \ --enable-auto-tool-choice \ --tool-call-parser qwen3_coder六、安装 ppt-master Skill本次测试客户使用的是ppt-masterSkill因此需要将该 Skill 安装到 Hermes 的本地 Skill 目录。宿主机路径/data/hermes-deploy/home/skills/ppt-master容器内路径/root/.hermes/skills/ppt-master安装后检查hermes skills list正常应能看到ppt-master local enabled七、安装依赖ppt-master需要使用 Python 脚本完成 SVG 检查、后处理和 PPTX 转换。进入容器docker exec -it hermes-agent bash使用清华 PyPI 源安装依赖python3 -m pip install \ -i https://pypi.tuna.tsinghua.edu.cn/simple \ --trusted-host pypi.tuna.tsinghua.edu.cn \ -r /root/.hermes/skills/ppt-master/requirements.txt实际安装过程中svglib可能触发pycairo编译。如果容器里没有编译器会安装失败。本次采用 CairoSVG 作为替代方案python3 -m pip install \ -i https://pypi.tuna.tsinghua.edu.cn/simple \ --trusted-host pypi.tuna.tsinghua.edu.cn \ cairosvg同时安装了 Inkscape用于 SVG 渲染和兼容检查inkscape --version检查 ppt-master 转换脚本python3 /root/.hermes/skills/ppt-master/scripts/svg_to_pptx.py --help八、启动 Hermes Agent建议每次测试新建独立目录避免旧项目污染结果。以 27B、98K 上下文测试为例cd /workspace mkdir -p /workspace/time_test_qwen36_27b_single_18pages_98304 cd /workspace/time_test_qwen36_27b_single_18pages_98304 HERMES_MAX_TOKENS4096 hermes \ --skills ppt-master \ --provider custom \ --model Qwen3___6-27B-W8A8 \ --yolo如果是 122Bcd /workspace mkdir -p /workspace/time_test_122b_18pages cd /workspace/time_test_122b_18pages HERMES_MAX_TOKENS8192 hermes \ --skills ppt-master \ --provider custom \ --model Qwen3.5-122B-A10B-AWQ \ --yolo说明--skills ppt-master指定使用客户 Skill--provider custom使用自定义 OpenAI Compatible 模型服务--model指定模型名称--yolo自动允许工具执行HERMES_MAX_TOKENS限制单次输出长度避免上下文爆掉九、18页 PPT 测试 Prompt为了减少耗时和上下文膨胀本次测试 prompt 中明确禁止 live preview、联网搜索和大段源码输出。示例 prompt请严格使用 ppt-master skill一次性从零生成18页中文彩色PPT用于测试模型端到端耗时。项目名hermes_agent_27b_time_test_ppt169_20260616 主题Hermes Agent 产品介绍受众企业技术人员和管理人员比例16:9 风格现代科技商务风配色深蓝、青绿、紫色渐变输出文件名hermes_agent_ppt_master_18pages.pptx 为了计时测试请不要启动 live preview不要启动 svg_editor/server.py不要联网搜索不要生成外部图片不要等待人工确认不要输出完整SVG源码、大段解释或大段diff只写文件并执行XML检查、SVG后处理和PPTX导出。每页采用中等信息密度和简单图形优先保证速度、页数正确和XML合法。页面结构 1封面2产品定位3核心能力4技术架构5模型接入6工具调用7浏览器自动化8文件处理9长期记忆10工作流程11深度规划12执行监控13实时看板14成本收益15企业集成16应用场景17成功指标18总结问答。要求严格18页逐页生成彩色SVG并保留svg_output避免文字重叠、越界和字号过小XML必须合法特别注意把转义为 amp;生成后执行XML检查、finalize_svg.py后处理、svg_to_pptx.py导出可编辑PPTX最终检查PPT页数必须为18页。最后只返回总耗时、PPTX路径、svg_output路径、svg_final路径、页数检查和XML检查结果。请从现在开始计时直接执行完整流程。十、生成过程说明ppt-master的主要流程如下内容规划 ↓ 生成 design_spec.md / spec_lock.md ↓ 逐页生成 SVG ↓ SVG XML 合法性检查 ↓ finalize_svg.py 后处理 ↓ svg_to_pptx.py 转换为 PPTX ↓ 检查 PPT 页数生成过程中会产生以下目录svg_output/ 原始 SVG svg_final/ 后处理 SVG backup/ SVG 备份 exports/ 导出的 PPTX十一、手动检查命令11.1 检查 SVG 数量find svg_output -maxdepth 1 -name *.svg | wc -l11.2 检查 SVG XML 合法性python3 - PY from pathlib import Path from lxml import etree path Path(svg_output) for svg in sorted(path.glob(*.svg)): etree.parse(str(svg)) print(OK:, svg.name) PY11.3 执行 SVG 后处理python3 /root/.hermes/skills/ppt-master/scripts/finalize_svg.py \ /workspace/projects/项目目录11.4 导出 PPTXpython3 /root/.hermes/skills/ppt-master/scripts/svg_to_pptx.py \ /workspace/projects/项目目录 \ -o /workspace/projects/项目目录/output.pptx \ --only native \ --no-notes11.5 检查 PPT 页数python3 - PY from pptx import Presentation ppt Presentation(output.pptx) print(slides:, len(ppt.slides)) PY十二、测试结果12.1 122B 测试结果模型Qwen3.5-122B-A10B-AWQ结果18页 PPT 生成成功 SVG XML 错误0 PPT 页数18 转换失败页数0耗时统计完整生成约 40 分钟12.2 27Bmax_model_len98304 测试结果模型Qwen3.6-27B-W8A8vLLM 上下文--max-model-len 98304结果一次性生成18页 PPT 成功 PPTX 导出成功转换失败0Hermes 显示耗时约 18 分钟十三、重要踩坑记录13.1 vLLM 必须启用工具调用如果没有加--enable-auto-tool-choice --tool-call-parser qwen3_coderHermes 会报auto tool choice requires --enable-auto-tool-choice and --tool-call-parser to be set13.2 Hermes context_length 不能只在客户端虚标Hermes 配置context_length: 98304只表示 Hermes 认为模型有这么大上下文。真正限制取决于 vLLM--max-model-len 98304必须通过接口确认curl http://模型IP:8101/v1/models看到max_model_len: 98304才是真正生效。十四、最终结论本次在 K100-AI 环境中成功部署 Hermes Agent并通过ppt-masterSkill 跑通了自主智能体生成 PPT 的完整流程。整体结论如下Hermes Agent 可以通过 Docker 方式稳定部署在 K100-AI 节点。Hermes 可以接入本地 OpenAI Compatible API 模型服务。ppt-masterSkill 可以完成从内容规划、SVG生成、SVG检查、后处理到PPTX导出的完整流程。使用 122B 模型可以稳定完成18页PPT生成但耗时较长。使用 27B 模型在 65536 上下文下容易在后段触发上下文超限。将 27B 的 vLLM--max-model-len调整到 98304 后可以一次性完成18页PPT生成。对于长PPT生成任务建议使用更大的上下文窗口并在 prompt 中禁止 live preview、联网搜索和完整源码输出。推荐配置模型Qwen3.6-27B-W8A8 vLLM max_model_len98304 Hermes HERMES_MAX_TOKENS4096 Skillppt-master 生成方式一次性生成18页中等信息密度禁止live preview最终效果18页彩色PPT生成成功 SVG XML错误0 PPT转换失败0 PPT页数18 27B-98K上下文耗时约18分钟

相关新闻

2026权威深度实测｜两款主流AI编程工具决策指南，vibe coding迭代能力全面对比

Prompt设计6策略：从一次性生成到多轮迭代的工程方法

印度服务器和美国服务器延迟对比

最新新闻

一个产品线的职责及其运作

linux(2)

【毕业设计】基于 SpringBoot 的抗癌心得分享论坛管理平台设计 慢性病癌症患者社群交流服务平台设计与实现(源码+文档+远程调试，全bao定制等)

H5的图片预览时被遮挡

计算机毕业设计之基于深度学习的人脸表情识别系统的设计与实现

HashMap 源码深度解析合集 - Java高频面试精选(7)1.LinkedList 插入真的是 O(1) 吗？深度解析 Java 双向链表的性能陷阱与源码真相04-192.HashM

日新闻

如何在1分钟内为Windows安装苹果USB网络共享驱动：完整解决方案

专业级Windows系统优化工具：WinUtil一站式自动化解决方案

液冷板焊接的能耗账：钎焊炉一年200万度电，激光产线只花十分之一

周新闻

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

月新闻

【毕业设计】基于 SpringBoot 的抗癌心得分享论坛管理平台设计慢性病癌症患者社群交流服务平台设计与实现(源码+文档+远程调试，全bao定制等)