Coze 智能体平台架构入门指南智能体 · 模型 · 插件 · 工作流 · 知识库
第 1 章 认识 Coze —— 你的第一个 AI 智能体平台1.1 Coze 是什么Coze扣子是字节跳动推出的一站式 AI 智能体开发平台。它让你无需编写复杂代码就能像搭积木一样组装出一个能聊天、能查资料、能调用工具、能执行多步骤任务的 AI 助手。打个比方如果你把 ChatGPT 看作一个「员工」Coze 就是「人力资源部 培训部 工具箱」帮你定制这个员工的性格、知识、技能和工作流程。1.2 为什么需要 Coze大语言模型LLM很强但它有天然短板不知道你公司的内部文档、不能发邮件、不能查数据库。Coze 把这些能力「外挂」给模型让它从聊天机器人升级为一个真正能干活的智能体。一张图看懂 Coze 解决了什么问题痛点普通 LLMCoze 智能体不知道最新信息训练数据截止到某个日期接入知识库实时检索不会使用工具只能纯文本回复通过插件调用任何 API不能执行多步任务一问一答工作流编排复杂逻辑缺乏个性化通用回答人设 记忆千人千面第 2 章 Coze 五大核心组件详解打开 Coze 的控制台你会看到五个关键词智能体、模型、插件、工作流、知识库。它们是构建智能体的「五件套」。下面逐一拆解。2.1 智能体Agent—— AI 的「人格」智能体是你创建的 AI 助手本身。它包含三个要素人设与提示词Persona Prompt定义智能体的身份、性格、说话风格。例如「你是一个温柔耐心的产品客服回答简洁友好。」模型选择Model指定「大脑」用哪个大模型见 2.2 节。能力绑定为智能体绑定插件、工作流和知识库让它具备特定技能。在桌面 server 项目中我们创建了一个名为 Coze 的智能体配置文件位于 configs/agents/cozeAgent.yaml前端通过 API 调用 /adh/agent/v0/engine 与之交互。2.2 模型Model—— AI 的「大脑」模型是智能体的底层推理引擎。Coze 支持接入多种大语言模型你可以根据任务特点灵活选择模型特点擅长场景一句话建议豆包 / 云雀字节自研中文能力强通用对话、中文文案中文场景首选DeepSeek推理能力强成本低逻辑推理、代码深度思考用这个GPT / Claude国际顶尖英文强多语言、创意写作海外场景适用关键理解模型决定「聪明程度」人设决定「性格」两者分开配置、组合使用。2.3 插件Plugins—— AI 的「工具箱」插件让智能体突破纯文本限制能够调用外部 API、数据库、第三方服务。举个例子必应搜索插件智能体可以搜索实时网络信息图片生成插件智能体可以直接画图飞书/邮件插件智能体帮你发通知、写邮件自定义插件接入你自己的 API比如查询订单状态在本项目的 Go 后端go-server/internal/coze/client.go中我们通过调用 Coze 的发布 API 和语音 API实现了自定义的 TTS 语音合成和流式对话本质上就是把 Coze 智能体包装成了一个可独立部署的服务。2.4 工作流Workflows—— AI 的「执行流程」如果说插件是单个工具工作流就是把这些工具串起来的一条「生产线」。它由节点和连线组成支持条件判断、循环、变量传递。典型的工作流步骤开始节点接收用户输入知识库检索节点从知识库中查到相关信息LLM 处理节点让大模型基于检索结果生成回复条件判断如果需要人工介入转接客服结束节点输出最终结果新手记忆法工作流就是 AI 的 SOP标准作业程序。一条工作流 一堆节点 连线每个节点做一件事数据在节点之间流转。2.5 知识库Knowledge Base—— AI 的「记忆外挂」知识库 RAG检索增强生成。你把公司文档、产品手册、FAQ 上传到 Coze智能体在回答前会先检索这些资料再用检索到的内容生成回复。这样做的好处信息准确基于你的文档回答不会胡编乱造实时更新上传新文档就能更新知识不用重新训练模型多格式支持PDF、Word、网页、飞书文档等知识库支持多种解析模式自动分段、自定义分段、表格解析等。上传文档后Coze 会自动将其「向量化」存入向量数据库检索时按语义匹配而非关键词匹配。第 3 章 五件套如何协同工作现在把五个组件串起来看看一个完整的智能体是如何运行的Coze 智能体运行全景图 用户输入⬇ 智能体人设 提示词 → 接收理解用户意图⬇ 知识库检索相关文档 插件调用外部工具/API 工作流编排多步逻辑⬇ 大语言模型 → 综合所有输入推理生成回复⬇✅ 智能体输出回复 → 文字 / 语音 / 图片 / 动作把这个流程想象成一位客服接线员人设 这个人说话的方式和态度「您好请问有什么可以帮您」知识库 他手边的 FAQ 手册和产品文档插件 他能用的电脑系统查订单、发邮件、退款工作流 他处理复杂问题的标准流程模型 他的大脑本身第 4 章 从 Coze 到数字人 —— 桌面 Server 实战4.1 项目简介桌面上的 server 文件夹是一个完整的开源数字人项目 —— Awesome-Digital-HumanADH。它的核心思路是前端Next.js 页面 Live2D 模型渲染 语音交互后端Go 服务go-server/负责转发请求到 CozeAI 大脑Coze 上创建的智能体同时绑定了插件、知识库、工作流、模型4.2 架构连线图下面是桌面 server 项目中各组件与 Coze 五件套的对应关系Coze 组件在 Server 项目中的角色代码位置智能体定义 AI 人设、对话逻辑Coze 云端控制台配置configs/agents/cozeAgent.yaml模型选择推理引擎豆包/DeepSeek 等Coze 控制台选择无需代码插件自定义 API 能力扩展go-server/internal/coze/client.go - 语音 TTS 自定义接入工作流乘客工单支付→评价→打赏→取消Coze 控制台编排 go-server/internal/workorder/知识库上传产品文档、FAQCoze 控制台上传项目代码不涉及4.3 完整数据流用户打开浏览器 → 访问数字人页面 → 说话 / 打字 → 前端发请求到 Go 后端 → Go 后端转发到 Coze → Coze 智能体调用模型 插件 工作流 知识库 → 返回回复 → Go 后端转成 SSE 事件 → 前端展示文字 Live2D 模型做口型 TTS 朗读关键: 密钥Coze Token只存在 Go 后端的环境变量中前端代码完全不接触 Token。这是安全最佳实践。4.4 启动步骤5 分钟跑起来步骤一启动 Go 后端打开 PowerShell执行cd C:\Users\81133\Desktop\server\go-server$env:ADH_GO_PORT8880$env:COZE_CHAT_URL你的 Coze 发布地址$env:COZE_TOKEN你的 Tokengo run .\cmd\adh-go验证浏览器访问 http://127.0.0.1:8880/healthz步骤二启动前端cd C:\Users\81133\Desktop\server\webpnpm install 首次需要pnpm dev浏览器打开 http://127.0.0.1:3000/sentio 即可使用。第 5 章 新手常见问题5.1 几个常见概念辨析容易混淆的概念一句话辨析智能体 vs 模型智能体 模型 人设 工具模型只是「大脑」插件 vs 工作流插件是单个工具工作流是把多个工具串起来的流程知识库 vs 微调知识库是外挂检索RAG微调是改变模型本身参数Coze Bot vs ADH 数字人Coze Bot 是后台智能体ADH 给它加了 Live2D 形象 语音5.2 新手建议的学习路径先在 Coze 网页版创建第一个智能体只配人设 选模型体验基础对话10 分钟添加知识库上传一份 FAQ 文档看智能体如何「学会」新知识15 分钟添加一个插件比如必应搜索看智能体如何「使用工具」10 分钟搭建第一条工作流做一个「输入城市名 → 查天气 → 穿衣建议」的流程20 分钟接入数字人前端按照第 4 章的步骤把 Coze 智能体变成有形象、有声音的数字人15 分钟5.3 一个比喻帮你记住把 Coze 想象成一家「AI 工厂」智能体 工厂的产品一个完整的 AI 助手模型 工厂的发动机提供推理能力插件 工厂的机床每个机床干一种活工作流 工厂的生产线把机床串起来知识库 工厂的资料室放着所有参考资料