「Agents do. Humans decide. That’s Octo.」在历史长河中技术的发展很少是一路线性往前走的很多关键变化发生在「连接」被打通的那一刻。拿计算机来说到了 20 世纪 60 年代它们已经具备强大的计算能力但大多还是各自封闭运行的系统。架构不同、接口不通彼此之间很难真正连在一起。直到 ARPANET阿帕网的出现这种孤岛的状态才被打破。计算机第一次在真正意义上连在一起开始共享信息、建立联系。如今以龙虾为代表的 Agent正面临半个多世纪前 IBM System/360 等大型机所遭遇的困境单体能力已经足够强但系统仍是分散的。从「单一 Agent」到「一张组织网络」过去很长时间AI 行业把大部分精力都放在了相同的事上把单个模型做得更强把单个 Agent 打磨得更能干。这条路走到今天其实已经接近一个阶段性的拐点在大多数实际工作场景里Bot 助手的能力不再是主要问题。作为单体 AI它们足够强大IM即时通信交互、写代码、做调研、推进任务都不在话下。真正卡住效率的是彼此之间「接不上」。Agent 被困在了各自的工作流中由于运行在不同工具、上下文和权限体系里各干各的彼此看不见、调不动也无法形成连续任务链条。它们可以各自完成一段工作却很难共同完成一件事情。一个人 一个 AI 助手本质上仍然只是效率工具只有当一群人和一群 AI 助手能够在同一个体系中协同工作才开始接近一种新的组织形态。对于 Agent 来说下一步除了变得更加聪明还要找到属于自己的「互联网」就像当年的计算机一样。在这样的背景下一个以人与 AI Agent 协作为基础、面向企业组织场景的开源平台 Octo 应运而生。该平台由全球 Agentic AI 第一股明略科技打造核心做一件事将分散在各个工作流里的 Bot 聚合到同一协作空间。更重要的是这种连接不只是个人维度的。在 Octo 中Bot 既是个人助手在经过授权之后也能在组织成员之间共享和调用。Bot 大军的自由流动让 Agent 的身份开始发生转变从个人工具蜕变为企业级资产和数字员工。随着 Bot 以组织形式部署、使用并沉淀它们不再各自为战通过分工协作在任务之间流转在过程中收到持续的反馈与评价并进行修正。项目地址https://github.com/Mininglamp-OSS更进一步在 Agent 等数字劳动力爆发的当下明略科技想要将 Octo 平台打造成为 Private AI 时代的组织基础设施构建人和 AI 协作的新范式。当企业开始拥有成百上千 Agent 时Octo 可以像管理互联网节点一样实现它们之间、它们与创建者之间以及创建者与创建者之间的高效连接、通信与协作。每个 Agent 既各司其职又相互协作这种工作模式在大多数场景中优于单一巨型模型。并且对普通用户尤其友好的一点是在 Octo 中常见的工作场景被打包成现成的 Bot 模板不用自己从头配「领养」就能直接拉进群里干活。在这里不用考虑繁琐的装虾流程易用性拉满。Agent不应只「活」在对话框里现在大多数 Bot 助手都是挂在 Discord、Telegram、飞书、钉钉这些 IM 里通过消息接收指令、执行任务。Octo 同样是从 IM 形态切入但它并不只是做一个更聪明的聊天工具更在于重写协作本身。在这里IM 更像是入口而不是核心。Octo 的 IM 界面人和 Agent 虽然在同一个 IM 界面沟通、下任务、接收结果。但真正发生变化的是背后的连接结构。在传统工具里人和 AI 往往是一对一的关系你下指令它完成任务整个过程封闭在各自的工作流里。现在Octo 把这层关系打破了它想连接的是人、Bot、Runtime Agent 和工具这些原本分散的节点。这也让它看起来不只是多了一个聊天窗口。更关键的是它在搭一套新的协作方式任务由人发起由 Bot 调用 Runtime Agent 完成执行。执行过程不断被反馈其他 Bot 接力人在关键节点做判断和取舍。更有意思的地方在于在 Octo 的底层通信协议里人和 Agent 从一开始就被设计为同等身份的消息主体。Bot 之间可以直接对话互相补充一只负责搜集信息一只负责分析一只负责纠错最后交给人来品鉴。这就是 A2A 协作真正发生的地方不是人指挥 AI、AI 反馈人的单向循环而是多个 Agent 之间形成了真实的任务接力。人在这个过程里的角色也跟着变了。复杂任务可以整包交出去Bot 负责拆解、调度、推进并 可以实时反馈进度判断是否需要人类或其他 Bot 介入、从哪里接手。人退到关键节点做判断和取舍而不是盯着每一步。当 Agent 从各自孤立的工作流里走出来效率提升只是表层变化。更深的影响是组织处理复杂任务的方式本身开始被重新组织。但连接只是第一步。把 Agent 拉到同一个空间里只解决了「能不能看见彼此」的问题。真正进入企业场景后更难的是另一件事复杂任务往往不会在一次对话里结束。它会经历需求澄清、资料补充、方案生成、多人反馈、反复修改和最终验收。在这个过程中信息、判断都在变化。因此在 IM 之外Octo 需要再往下沉一层为每一件复杂任务建立稳定的承载单元也就是接下来要讲的 Matter事项。从「连接」到「干活」将复杂任务拉进事项里复杂、长程任务需要继续回答一个问题事情怎么干成、怎么干对、怎么留得下这正是 Matter 要解决的。在普通 IM 里信息天然会被滚动消息淹没。今天讨论一个方案明天又有新的消息刷屏。一周后想追溯当时为什么选 A、放弃 B只能在聊天记录里大海捞针。对复杂任务来说这种信息形态远远不够。针对这种局限Matter 把每个任务沉淀成一张可追溯的「决策卡」不只记录最终结果还包括任务缘起Brief、过程时间线Timeline、关键产出、人的反馈和验收结论。一个事项从 Brief 开始沿着 Timeline 展开中间有产出、有打回、有补充、有确认最后形成可以回看的组织记忆。这对企业来说非常关键。在真实工作中很多价值并不单单存在于最终文档里。为什么选择一个方案哪些判断来自业务负责人哪些修改来自法务、销售或技术同学这些信息共同构成了组织的决策资产。以保存消息为主要目标的普通 IM 工具难以承载这些资产而Matter 要保存的是一件事如何被推进、修正和完成。除了可以把过程保存下来Matter 更重要的价值在于复杂任务里的每一次修改、打回和验收本身都带着人的判断。一旦这类反馈进入到 Matter它们便从一次性的沟通记录转变成了 Agent 学习组织偏好的原材料。Octo 所追求的 Taste也正是在这个位置生长出来。越用越懂你在实战中沉淀 TasteMatter 解决了「事情如何留下来」而 Taste 让「Agent 越用越懂你」。今天的很多 Agent 都有自己的配置文件、工具说明和角色设定但它们的自我成长仍然有限。一个团队喜欢什么样的风格什么样的结论才算有洞察这些偏好很难靠一次系统提示写清楚。很多时候人类的判断本来就是隐性的。举一些例子负责人说「这个感觉不对」客户说「这个角度不准」这些反馈背后的经验、品味和行业语境不一定马上就能写成一套规则。因此「偏好对齐必须在实战中完成」成为 Octo 塑造 Taste 所采取的思路。人的每一次打回、圈一笔、修改、确认都可以成为 Bot 学习组织品味的素材。一次方案退回可能是逻辑不够收束一次报告重写可能是结论缺少业务视角。这些信号在沉淀到 Matter 之后它们就有机会被提炼成下一次可复用的偏好。这个过程可以理解为人把说不清的「我就要这个」逐渐沉淀为 Agent 可以理解、调用与继承的偏好。下次遇到类似任务相关偏好会自动进入上下文。这样一来Bot 会在一次次实战中更接近团队的做事方式并理解公司的决策、交付模式。当 Bot 拥有了差异化的偏好多 Agent 协作的关键就变成了「如何让它们在同一任务中合理分工」避免被简单地拉进同一个群聊里一起发言。Octo 的六种协作模式解决的正是这个问题。六种协作模式本质是六种信息拓扑多个 Agent 一起协作并不等于「多叫几个 Bot 进群」。更细化的问题决定了执行效果比如信息怎么传谁负责生成谁负责验证哪些任务需要独立视角哪些任务需要公开讨论哪些步骤必须按顺序进行哪些任务可以分头推进面对不同层次的需求Octo 将复杂协作拆成了六种模式Solo 是单干模式适合简单明确的任务由领队独自完成。Roundtable 是圆桌讨论在领队主持下多个 Agent 围绕同一议题展开公开讨论参与者互相可见适合需要形成共识、碰撞观点、收束结论的任务。Critic 是生成 — 验证模式其中一个 Agent 负责生成另一个 Agent 负责审核生成方和验证方必须不同。验证方有否决权发现问题可以打回重做。该模式适合需要独立审查的场景比如代码检查、事实核查、方案质检。Pipeline 是流水线模式从 A 到 B 到 C 严格串行每一步的产出作为下一步的输入。它适合存在明确顺序依赖的任务比如先调研再分析再写作再校对。Split 是分头干模式领队把任务拆成互不可见的子块由多个 Agent 各自处理最后再由领队合并。它适合大任务分治比如一个行业报告拆成政策、市场、技术、案例几个部分。Swarm 是撒网竞选模式同一个任务交给多个 Agent 独立完成参与者彼此互盲最后由领队择优。它适合需要多解并行、避免从众的场景比如标题、方案创意、产品命名、不同分析路径。整体看下来Octo 多协作模型不仅是把 Bot 拉到同一个地方还规定了信息流转的方式不同任务匹配不同拓扑系统保证信息沿正确路径流动。相较之下飞书或 Slack 群聊里的 AI 可以让所有人看到所有消息但复杂任务经常需要更细的隔离。群聊擅长「都看见」却很难做到「该互见时互见该互盲时互盲」。换句话说Octo 对协作的理解已经超出了「多人聊天」这一层。在真实组织里协作包括了空间划分、权限边界、上下文继承、过程追踪、任务拆解、反馈沉淀和最终验收。人类过去依赖项目管理系统、知识库、IM、文档和会议来完成这些工作Agent 加入之后这套协作骨架也随之改变。拆开来看Octo 在做四件事从产品形态看Octo 正让 Agent 像组织成员一样进入工作流用 IM 承载交互用空间、分组、频道、子区搭建协作结构用语音提升输入效率用浏览器插件接入外部工具再用 group.md 约束协作方式。先看结构层空间Space、分类Category、频道Channel和话题Thread将协作关系组织得很清楚。在 Octo 里 一项任务通常是在某个空间里被提出可能是一个简单的问题也可能是一段更完整的描述。无论形式如何这条信息一出现就带着明确的上下文属于哪个空间面向目标的工作区在哪个频道可以理解为群聊话题是什么可以理解为群聊子区。和普通聊天不一样新消息不会很快被冲掉自然地落在某个频道或话题里变成一件可以一直跟进、随时回溯的事情。接下来是入口层。在 IM 界面私聊和语音让我们进入这套系统的方式变得更简单。通过人与人、人与分身的一对一对话通道私聊可以让人与 Agent 在同一个上下文中沟通、分工、反馈不需要额外学习新的交互方式就能把任务放进去、再把结果拿出来。但当协作变复杂问题可能会出现在输入这一端。很多时候不是 Agent 做不出来反而是人来不及把需求讲清楚。输入慢导致整个流程就跟着慢下来。引入语音之后信息可以更快进入系统任务描述、上下文补充和决策反馈都更顺手。然而Octo 内置的语音输入不只是将声音转成文字它同样也是一个持续进化和学习的系统。它会结合当前对话的上下文对转写的内容进行修正和梳理一方面提高准确率另一方面让表达更清晰、更有逻辑。同时对于团队中的人名、公司名或者行业专有名词出现频率越高它认得越准。另外你还可以语音 他人、修改已有内容甚至删掉前面的输入。在这里语音接近一种可以参与操作的交互方式。从能力上来看这套机制与市面上一些语音驱动操作的产品相似但它是直接嵌在整个协作流程里随着任务一起向前推进。环境接入层则更像是一个「上下文桥接器」。这一层并不是用来取代工具的把已有工具接进来是它的主要任务。通过内置的浏览器插件用户可以通过「Cmd K」把外部工具无缝接入进来。无论是在网页、文档还是代码平台上只要选中一段内容当前页面的链接、标题和选中文本就会自动被带入上下文。在将这些信息一键发送给 Bot 或者在当前对话引用后它们立即接手并知道你在处理什么问题、处在什么环境。它不需要把你从现有工具流中「拉走」在旁参与协作即可。真正的分水岭出现在后面这一步。在大多数团队里难的不只是把事情做完让 AI「行为可控」同样至关重要。GROUP.md 的作用正体现在这里。它相当于一份专门设给 Bot 看的「行为准则」明确了一个群聊的定位、协作模式和行为边界。每一次对话、每一条任务指令所有参与进来的 Bot 都会在遵守 GROUP.md 规则的前提下执行确保讨论高效且有序。并且当切换到另一套 GROUP.md 时同一只 Bot 马上调整工作模式「进什么庙念什么经」绝不逾矩。此外Octo 还强调多端补全Web、移动端、浏览器插件、CLI 共同构成入口。尤其是 CLI它连接端侧环境和私有化部署叙事让本地模型、本地文件、本地运行环境进入协作体系。O.C.T.O.四个维度缺一不可至此Octo 的产品能力就比较清晰了它们分别对应名字背后的四个维度Open、Context、Taste 与 Orchestration。O 是「Open」代表开放生态。不同 Runtime 的 Agent包括 OpenClaw、Codex、Claude Code、Cursor 等都能够以 Bot 身份接入获得统一身份。C 是「Context」代表共享上下文。IM 中的讨论收敛为结构化知识项目上下文在不同 Agent 之间共享任务过程也可以被持续追溯。T 是「Taste」代表偏好进化。实战反馈沉淀为偏好每个 Agent 背后主人的品味和判断方式被结构化留存与调用。O 是「Orchestration」代表多 Agent 编排。六种协作模式对应六种信息拓扑不同 Bot 带着不同偏好参与同一任务合力完成复杂工作。这四个维度连在一起构成了 Octo 所提供的完整能力。承载起 Context、Taste、Orchestration 的共同基座正是 Matter它成为复杂任务得以被理解、反馈、校准和编排的核心容器。没有 MatterContext 会散落在聊天记录里Taste 会缺少来自真实任务的反馈来源多 Agent 编排也很难留下可追溯的过程和结果。Octo 想要把一次次协作转化为组织资产就必须先让每一件事有稳定的结构、完整的过程以及可以沉淀的判断。从这个视角来看Octo 想争夺的是企业在 Agent 时代最关键的一类资产自己的上下文、判断标准以及做事方法。写在最后像 Octo 这样的尝试补上的不只是把 Agent 连在一起的能力也在悄悄改变组织内部知识流动和协作的方式。但这并没有走向另一种极端。人不可替代的部分包括 Taste、暗默知识、判断力依然留在个体身上只是通过协作过程得到进一步彰显和传递也就是说「能力可以共享但判断不会被抹平。」这也带出了一个更根本的问题在 AI 时代企业真正的长期竞争力究竟来自哪里当模型能力快速趋同长期竞争力更多来自企业自己的 Context、Taste 和 Skill。这些东西无法被复制也不应该流失它们才是组织在 AI 协作中真正的「护城河」。正因如此当 Agent 真正进入组织运转数据主权问题变得无法回避这些上下文、判断信号与执行记录究竟归谁所有、留在哪里、由谁控制Octo 给出的答案很直接走私有化路径通过开源开放支持本地部署。在实现上Octo 以 CLI 接入的方式将端侧模型与本地环境接入进来工作流中产生的上下文、决策过程与执行结果同样留在端侧沉淀为组织可以掌控的资产。这意味着包括聊天数据、协作产出、Bot 记忆在内每条对话、每行代码都保留在你的环境中完全跑在自己的服务器上。所有这些都将成为企业独享的 AI 资产。在 Octo 的产品哲学中「Context」与「Taste」是两大核心前者是 AI 理解任务的土壤后者是持续校准方向的罗盘。Octo 并非将人的隐性能力蒸馏为平台资产它是在尊重数据边界的前提下让这些能力得到放大、记录与传承。这与明略科技长期坚持的可信 AI 方向高度一致。明略科技持续构建面向端侧智能、私有化部署与人机协作的新一代 AI 基础设施能力可以流动但数据不外流协作可以展开但控制权留在组织内部。对企业Private AI 不只是本地化部署更是数据主权、知识主权与协作主权的真正回归。对个人真正被放大的价值是 Taste—— 我品故我在当 AI 逐步接管了思考人的判断力、鉴赏力与创造力不会被取代反而成为存在的意义本身。支撑这一切的底座是 Trustworthy AI开源、白盒、可审计。只有当 AI 的能力来源、运行过程和协作边界足够透明人才放心将「思」交给它们把「品」留在自己手里。Octo 的探索还在早期但轮廓已经清晰当 Agent 更深入地嵌入分工体系真正决定效率的是那些无法被标准化、也不应该被外流的东西 —— 组织自己的上下文和人自己的判断。原文链接一个开源平台编织起了Agent「互联网」-36氪