过去一年Agent 的能力进化很快会调用工具会拆解任务会跨系统协作也能把复杂目标拆成计划、执行、检查和修正。但当 Agent 真正进入任务执行阶段一个老问题会重新出现用户不想在长文本里找按钮也不想把结构化信息重新复制到表单里。让 Agent 规划一场活动它不应该只返回一屏 Markdown而应该给出一个可以确认、修改、继续执行的面板。让 Agent 推荐多个方案它不应该只写几段相似的文字而应该把方案放进卡片让用户能直接比较、筛选和选择。让 Agent 收集参数它不应该反复问“请回复 1/2/3”而应该直接生成输入框、多选项和提交按钮。这正是A2UIAgent to UI智能体到界面要解决的问题。A2UI 的核心不是让模型随意生成前端代码而是让 Agent 输出声明式、可校验、可由宿主应用安全渲染的 UI 描述。换句话说Agent 不只给答案还能根据当前任务生成合适的交互界面。现在JiuwenSwarm 已经支持 A2UI并打通了从 UI 生成、协议校验、前端渲染到用户事件回传和下一轮对话的完整闭环。作为openJiuwen的标杆智能体 JiuwenSwarm沉淀了 openJiuwen 平台在 Harness 工程、多智能体协同、自演进等关键方向上的完整能力。openJiuwen 是华为云智果 AgentArts 企业级智能体平台的开源版由华为 2012 实验室、华为云 AgentArts 团队与行业开发者联合构建致力于加速行业智能体规模化落地。JiuwenSwarm 率先实现对 A2UI 的全面支持这也意味着这款源于企业级架构基因的开源智能体框架正在引领 Agent 从“文本回复”走向“生成式界面”。为什么 Agent 不能只停留在聊天框里聊天框足够通用也足够自然。用户可以随便说Agent 可以随便答。这让 AI 快速进入搜索、写作、总结、代码、客服等场景。但聊天框也有边界。当回答只是知识解释时文本很好当任务进入执行阶段时文本就开始变得笨重。比如用户让 Agent “帮我安排下周发布会的准备工作”。一个合格 Agent 可以生成计划周一确认议程周二准备海报周三整理嘉宾材料周四彩排周五发布。这当然有用但下一步呢用户可能还要选择优先级、调整截止日期、指定负责人、确认是否创建提醒。纯文本对这些操作并不友好。用户需要读、复制、改写、回复Agent 还要再理解一次用户意图。A2UI 的价值就是把这些摩擦变成可操作的界面。场景传统文本体验A2UI 体验信息收集Agent 逐项追问用户复制粘贴直接生成表单用户填写后提交任务确认文本列出计划用户回复“确认”生成确认卡片按钮触发下一步多方案比较Markdown 表格难以继续操作卡片/列表展示可直接选择方案工具结果展示输出一长段结果说明结构化详情、状态面板、操作按钮审批流用户用自然语言表达同意或拒绝按钮提交同意、拒绝、补充意见这不是把 Markdown 美化一下也不是给聊天框加几个固定按钮。真正的变化在于界面是 Agent 根据上下文动态生成的。今天用户要确认任务计划就生成确认面板明天用户要比较三种部署方案就生成对比卡片后天用户要填写模型配置就生成表单。界面不再只是产品经理提前设计好的固定页面而是 Agent 在任务发生时生成的临时工作台。A2UI 是什么让 Agent 生成可交互界面A2UI 是 Google 发起的一项开源项目可以理解为一种面向 Agent-driven interfaces智能体驱动界面的声明式 UI 协议。它解决的不是“界面好不好看”的问题而是“Agent 如何安全、稳定、可控地生成界面”的问题。这里有三个关键词。第一声明式。Agent 不直接生成和执行 HTML、CSS、JavaScript 代码而是输出结构化 UI 描述例如表单、按钮、卡片、列表、状态面板以及这些组件之间的字段和事件关系。第二可校验。A2UI 输出可以经过 schema 校验。字段是否完整、组件类型是否合法、事件是否符合约束都可以在进入前端之前被检查。第三宿主渲染。真正负责渲染的不是模型而是宿主应用。对于 JiuwenSwarm 来说就是由 JiuwenSwarm Web 前端使用自己的组件体系渲染合法的 A2UI block。而基于华为云智果 AgentArts 在企业级场景下的深厚沉淀开源版的 openJiuwen 在设计之初就极其重视安全与工程边界完美兼顾了灵活性与企业级安全为 JiuwenSwarm安全、稳定、可控地构筑智能体交互体验打下夯实底座。因此A2UI 不是“让模型随便写前端代码”而是把 Agent 的交互意图变成一种受控协议{ type:form, title:确认文章发布计划, fields:[ {id:priority,type:select,label:选择重点方向} ], actions:[ {id:confirm,label:确认并继续} ] }上面只是简化示意。它想表达的是Agent 输出的不是一段不可控代码而是一份可以被校验、被渲染、被点击、被回传的 UI 描述。这也是 A2UI 最关键的工程价值保留生成式界面的灵活性同时把渲染权和安全边界留在宿主应用手里。一个例子从“回复编号”到“点击确认”我们看一个非常常见的场景任务方案确认。用户说安排一个发布文章的执行计划给我 3 个重点方向我确认后再开始。传统对话里Agent 可能会返回一段 Markdown用户需要阅读、理解再手动回复“选第 2 个”或“都可以”。如果后续还要补充字段就会继续进入多轮追问。开启 A2UI 后Agent 可以直接生成可交互确认面板用户不再需要组织回复格式只要选择重点方向并点击确认。前端把这次操作包装成结构化事件后端再把它转换为模型能理解的下一轮输入。过去是Agent 给文本用户读文本用户再用文本回复。现在是Agent 给界面用户操作界面Agent 拿到结构化结果。对用户来说这意味着少打字、少歧义、少返工对开发者来说这意味着不必为每一个 Agent 场景提前开发固定页面可以把表单、卡片、确认、结果展示沉淀为统一协议能力。更多 A2UI 场景不只是确认还能展示与收集A2UI 的价值并不只体现在“把确认按钮做出来”。在真实任务里Agent 既要把信息更直观地展示出来也要更高效地向用户收集结构化输入。例如在旅游导览、知识讲解或内容推荐场景中Agent 可以直接生成图文并茂的卡片把关键信息、配图和必看亮点组织在同一个面板里让用户一眼看清核心内容又比如在商品推荐、设备选型或方案筛选场景中Agent 可以直接生成表单收集预算、品牌偏好、使用场景和特殊需求再基于结构化输入继续完成推荐这两个例子体现了 A2UI 的两个重要方向信息展示更结构化复杂内容不再只靠长文本解释而可以通过卡片、分区和图文组合更清晰地呈现。需求收集更高效用户不必在对话里一点点补充条件而可以一次性通过表单提交关键参数。交互链路更顺滑展示、选择、填写、提交都发生在对话上下文中不需要跳转到额外页面。对开发者来说收益同样明显不需要为每一个 Agent 场景提前开发一套固定页面。不需要把所有交互都降级成“回复编号”。可以把表单、卡片、确认、结果展示沉淀为统一协议能力。可以让 Agent 输出先经过校验和修复再交给前端渲染。最后再让我们一起看一个视频demo直观感受A2UI带来的交互能力提升。A2UI 和固定页面有什么不同很多产品过去也会在聊天框旁边放按钮、表格、表单或侧边栏。那是不是已经等于 A2UI并不是。固定页面的逻辑是产品先预设场景前端提前写好页面Agent 只负责把数据填进去。它适合稳定流程比如登录、配置、订单详情、审批列表。A2UI 的逻辑是任务先发生Agent 再判断当前最适合什么界面。它可以在同一个聊天窗口里根据上下文生成不同的交互形态。对比项固定页面A2UIUI 来源产品和前端提前开发Agent 根据当前任务生成适合场景稳定流程、固定路径动态任务、多轮协作扩展方式新场景通常要开发新页面新场景可复用协议和组件安全边界前端代码控制声明式协议 宿主渲染交互闭环页面事件进入业务系统UI 事件回传 Agent继续对话这意味着界面不再只是产品功能的外壳而是 Agent 推理结果的一部分。Agent 不仅决定“回答什么”还决定“用什么交互形态把回答交给用户”。这也是 JiuwenSwarm 支持 A2UI 的核心原因Agent 最终要服务真实任务而真实任务往往需要操作不只是阅读。JiuwenSwarm 如何把 A2UI 跑成闭环JiuwenSwarm 对 A2UI 的支持不只是简单加了一段 prompt。它承继了华为云智果 AgentArts在复杂场景的行业实践与技术积淀将企业级的全链路架构能力开放出来补齐了完整的运行时链路。一条典型链路如下用户在 JiuwenSwarm Web 中发送自然语言任务。AgentServer 在 Web channel 且 A2UI 功能开启时向模型注入 A2UI runtime prompt。模型在合适场景输出文本和a2ui-json.../a2ui-json。AgentServer 对 A2UI 响应进行解析、schema 校验、repair 和 finalization。Web 前端识别合法 A2UI block并渲染为表单、卡片、按钮等组件。用户点击、选择、提交后前端把事件包装为a2ui.client_event。后端把这次事件转换为模型可读 prompt进入下一轮对话。这条链路的关键不是“模型能不能生成一个好看的卡片”而是整个系统能不能把生成、校验、渲染、交互回传和下一轮推理稳定串起来。只有形成闭环A2UI 才不是 demo而是可以进入产品运行时的能力。工程落地的关键可控、可回退、可扩展A2UI 真正落地时不能简单相信模型输出。模型可能输出不完整 JSON可能忘记协议字段可能把按钮事件写错也可能在不需要界面的场景强行生成卡片。如果这些内容直接进入前端用户体验会不稳定甚至可能影响普通对话。所以 JiuwenSwarm 没有把 A2UI 做成一个松散的提示词能力而是把它放进运行时链路里生成约束只在 Web channel 且功能开启时注入 A2UI runtime prompt避免影响非 Web 场景。协议解析从模型输出中识别a2ui-jsonblock将普通文本和 UI 描述分离。结构校验通过 A2UI schema 校验 UI 描述是否合法避免无效结构进入前端。自动修复对轻微格式错误进行 repair降低模型输出不稳定带来的影响。最终收敛finalizer 在完整回复返回前完成最后检查确保返回结果可消费。安全渲染前端只渲染合法 A2UI block不执行模型生成的任意前端代码。事件回传用户操作被封装为a2ui.client_event进入下一轮 Agent 推理。能力回退关闭 A2UI 或生成失败时普通文本和 Markdown 路径不受影响。这套设计有一个很重要的效果A2UI 是增强能力不是风险扩散点。如果模型没有使用 A2UI用户看到的仍然是普通回复。如果模型生成的 A2UI 不合法系统会尝试修复或回退避免把破碎 UI 暴露给用户。如果用户在非 Web channel 使用 JiuwenSwarm也不会被迫看到一段无法渲染的 JSON。对开发者来说这比“模型吐一段 JSON前端自己试着渲染”更可靠。A2UI 会优先改变哪些工作流A2UI 最先影响的不是闲聊而是所有需要结构化输入和明确动作的场景。在个人效率场景里待办拆解后可以直接生成任务列表和确认按钮日程规划后可以直接选择时间、优先级和提醒方式周报生成前可以先让用户勾选本周重点、补充遗漏事项、确认是否隐藏敏感内容。在企业办公场景里报销审批可以生成字段确认卡客户跟进可以生成下一步动作面板会议纪要可以生成待办认领、截止时间确认和同步范围选择数据分析结果可以生成指标卡、筛选器和导出按钮。在开发者工具场景里代码审查结果可以变成按文件分组的修复面板CIContinuous Integration持续集成失败分析可以变成原因、证据、建议操作的结构化视图配置向导可以由 Agent 动态生成不必提前穷举所有路径。这些场景的共同点是用户不是只想“知道答案”而是想“继续推进”。A2UI 把继续推进所需的界面放回了 Agent 对话本身。如何在 JiuwenSwarm 中启用 A2UIA2UI 的使用方式很简单用户不需要安装额外插件也不需要理解底层协议只需要在 JiuwenSwarm Web 端打开 A2UI 能力开关目前默认关闭开启后刷新页面即可生效。开启后用户仍然可以像平时一样用自然语言向 Agent 发起任务。例如可以这样说帮我生成一个手机需求收集表单收集预算、品牌偏好、拍照需求、游戏需求和续航要求然后根据填写结果推荐合适的手机。也可以这样说帮我整理故宫太和殿、乾清宫、珍宝馆和御花园的参观亮点用图文卡片展示。当任务适合结构化交互时JiuwenSwarm 会让 Agent 自动生成可操作的 A2UI 界面。用户可以直接填写表单、选择选项、点击按钮或提交信息而不是反复在聊天框里补充条件。提交后这些操作会被转换成结构化事件回传给 Agent。Agent 会基于用户的选择和填写结果继续推理推进下一步任务。如果当前任务不适合生成界面Agent 仍然会正常返回文本或 Markdown。如果 A2UI 关闭JiuwenSwarm 也会回到普通对话体验不影响原有使用流程。结语Agent 从“会回答”走向“会协作”Agent 的下一阶段不只是更聪明地回答问题而是更自然地推进任务。A2UI 让 Agent 可以在合适的时候生成表单、卡片、按钮、列表和状态面板把原本需要用户复制、改写、确认的步骤变成直接可操作的界面。对用户来说这意味着更少输入、更少歧义、更快推进。对开发者来说这意味着不必为每一个 Agent 场景都提前写死页面而是可以通过统一协议把动态交互能力沉淀为可复用的运行时能力。JiuwenSwarm 的目标一直是随叫随到的智能管家让 AI 触手可及。A2UI 让这个目标更进一步触手可及不只是能和 Agent 对话而是 Agent 能把下一步操作直接放到你手边。参考链接Google Developers BlogIntroducing A2UI: An open project for agent-driven interfaceshttps://developers.googleblog.com/introducing-a2ui-an-open-project-for-agent-driven-interfaces/Google A2UI GitHub Repositoryhttps://github.com/google/A2UIGoogle A2UI DocsWhat is A2UI?https://github.com/google/A2UI/blob/main/docs/introduction/what-is-a2ui.md关于 openJiuwenopenJiuwen 是华为云智果 AgentArts 企业级智能体平台的开源版由华为 2012 实验室与华为云 AgentArts 团队联合构建其内核与 AgentArts 企业版同源度超过 90%。该平台全面践行 Harness 工程致力于加速行业智能体规模化落地。在智能体规模化落地的关键窗口开源成为凝聚力量、加速共创的最优路径华为云智果 AgentArts 将核心能力开源至 openJiuwen 社区共筑产业繁荣生态。