从聊天窗口到工作台:这半年,我的 Agent 工作流换了一代
TL;DR快到年中了。回头看这半年我换掉的不只是云上的主力 Agent也把入口从聊天窗口换成了工作台Hermes 在云上做中枢OpenCode 留在本地做 codingDiscord 则第一次让多 session 工作流真正成立。背景回头看这半年真正变的不是某个 Agent而是我和 Agent 协作的整个结构。开年那阵子我还在用 OpenClaw。当时写过两篇相关的博客一篇是 《我让龙虾替我工作了 38 天它做了什么》盘它到底替我干了什么另一篇是 《Agent 装 Agent用 OpenClaw 安装 Hermes顺手验证自我进化》让 OpenClaw 去安装 Hermes Agent顺手看看它所谓的自我进化到底是不是一回事。那时候的 Hermes Agent对我来说更像一个值得研究的新对象还不是来接管 OpenClaw 的主力。但这几个月下来情况慢慢变了。现在我的云上主力 Agent已经从 OpenClaw 完全迁到了 Hermes Agent。部署仍然在云上只是机房从香港换到了新加坡原因也很现实Claude 在不同地区的使用政策并不一样大陆和香港这边就用不了。真正写代码这层没有跟着一起迁走还是继续交给本地的 OpenCode。变化最大的反而是入口我几乎完全从 Telegram 转向了 Discord。所以这次变化看起来像是在换工具实际上更像是整套 Agent 工作流换了一代。从尝鲜到接管当初装 Hermes Agent主要还是想看看它到底值不值得用。吸引我的不是它能不能替代 OpenClaw而是它对 Skill 生命周期和自我进化的理解不是把 Skill 当静态说明书而是让 Agent 在任务里自己总结、自己沉淀、自己迭代。但后来真正让我迁过去的不是某一个单点功能而是它越来越贴近我日常真正需要的那个位置长期跑在云上稳定接入口能把会话组织起来能接工具能查资料也能接住我的想法继续往下推。到这一步Hermes Agent 在我这里就不再是 OpenClaw 旁边的实验品了而是正式接管了云端主力的位置。Agent 的交互容器决定了它能不能真正变成工作流我后来把云上 Agent 的主要入口从 Telegram 切到了 Discord。原因不是 Telegram 不能用而是它更像一个单线聊天入口。Telegram 不是没有多会话能力而是多会话组织得不自然。普通私聊里同一个 bot 基本只有一个主会话想并行开多个任务通常得额外建多个 group或者再借助 topic。想找回、继续过去的某个会话也总归有点费劲。Discord 则天然是另一种结构。Hermes Agent 本身支持 DiscordOpenCode 通过 Kimaki 接进去。我现在的习惯很简单一个 thread 开一个任务。thread 在这里不是聊天分叉而是 session 的边界。任务被隔开了上下文不再糊成一团多条线并行往前推也自然得多。所以这次迁移真正改变的不只是我在哪个平台发消息而是 Agent 第一次有了一个适合承载工作流的容器。PC 端更宽的展示区域只是表面更关键的是Discord 让 Agent 不再只是“回消息”而是真开始在一个有结构的空间里工作。Hermes 做中枢OpenCode 留本地云端主力虽然已经迁到 Hermes Agent但 coding 这层我没有一起迁走还是继续交给本地 OpenCode。对我来说Hermes Hermes 更像中枢长期跑在云上接 Discord接工具接住讨论也负责把任务组织起来。OpenCode 则更像贴着仓库干活的本地执行器真正进入项目目录把实现往前推。进入 coding 之后我一般还是会尽量用OpenSpec和addyosmani/agent-skills这套组合把实现放进 Harness Engineering 的约束里。它们对我很重要不是因为能让 Agent 更放飞而是因为能让实现少一点无约束的发挥少一点“先写出来再说”的冲动。但即便这样我对这件事还是很慎重。原因很简单工程化流程可以补强执行却替代不了判断。正如我在最近那篇 《Loop Engineering 的边界与悖论》 里写的Loop Engineering 的边界换成 LLM coding 一样成立。所以对我来说变化并不是“越来越依赖 Agent”而是用得越来越多判断也越来越重。Agent 参与得更深了但真正该自己扛的判断并没有因此变轻反而更重了。不是摘要器而是第二轮讨论对象另一个很明显的变化是我越来越喜欢跟 Agent 聊天、讨论甚至 battle。但这不是把文章丢给它让它替我读。相反通常是我自己先读觉得某篇文章、某个观点、某个开源项目值得继续深挖才把它转发给 Agent。而且我很少只丢一个链接过去往往会顺手带上自己的判断我觉得它哪里说得对哪里站不住或者我真正想验证的点是什么。这样一来Agent 就不是摘要器而成了第二轮讨论对象。它接住的不是原始材料而是我已经开始成形的想法然后再配合搜索、抓取这类工具把这条线继续往下推补资料找原文拆论证找反例必要时直接跟我 battle 一轮。它更像一个带工具的讨论对象而不是一个负责替我读材料的助手。某种意义上说Agent 现在不只是进入了我的执行流也开始进入我的思考流。结尾回头看这次变化不是把 OpenClaw 换成 Hermes也不是把 Telegram 换成 Discord 这么简单。更准确地说我是在把 Agent 从“聊天机器人”往“工作流基础设施”那个方向再推一步。Hermes Agent 现在是云上的中枢OpenCode 仍然守在本地的 coding 现场Discord 则把它们放进了一个终于适合多 session 生长的容器里。工具当然还会继续换模型也还会继续变。但至少到现在这半年走下来我对这套结构的判断已经很明确了Agent 的交互容器决定了它能不能真正变成工作流。