Agent实战 #00:从0到上线14个Agent,4C8G部署全记录
部署环境4C8G 阿里云 ECS · HTTPS 公网访问 · 已备案技术栈Spring Boot 3 Spring AI Spring AI Graph Vue/React PostgreSQL/pgvector写在前面这是一个AI Agent 工程实战系列。与大多数 Agent 教程不同全部 Agent 已上线公网可以直接访问体验。不是 Jupyter Notebook 里的 Demo不是跑在本地的玩具项目——14 个 Agent 部署在一台 4C8G 的阿里云 ECS 上通过 HTTPS 对外提供服务。每个 Agent 都有独立的文章从需求分析到架构设计从核心代码到部署踩坑完整记录。适合读者有 Spring Boot 基础、想了解 AI Agent 工程化落地的后端开发者。如果你已经熟悉 LangChain/LangGraph可以直接跳到自己感兴趣的文章看核心代码。名词速查Spring AI GraphAgent 工作流编排框架对标 LangGraph支持状态机、条件分支和中断恢复MCPModel Context ProtocolAgent 工具调用协议类似微服务中的 HTTP/RPC支持跨语言调用RAGRetrieval-Augmented Generation检索增强生成先从知识库检索相关内容再让大模型基于检索结果回答HITLHuman-in-the-Loop人在回路关键决策节点引入人工审核RRFReciprocal Rank Fusion倒数排名融合解决多路检索排序不一致问题整体架构架构设计思路三前端Vue3 主站 React 学习助手 React 内容管理台各前端独立部署接入层Nginx 统一 HTTPS 入口 Spring Cloud Gateway 负责鉴权、配额管控和路由分发Agent 层Java Spring AI 承载各业务 Agent复用 Spring Boot 企业级生态事务管理、安全认证、中间件集成编排层Supervisor 主图用 JavaSpring AI Graph实现意图路由 → 子图分发Python 服务承载内容增强/BI/学习等专项 Agent 能力数据层PostgreSQL pgvector 统一存储关系数据和向量数据Redis 做缓存和 CheckpointRocketMQ 做异步解耦两条调用链路外部请求客户端 → Nginx → Gateway → 各 Java Agent鉴权 配额统一在 Gateway 完成Agent 编排Gateway → Java Supervisor Graph → 子图分发RAG / 代码审查 / 通用对话内容创作等场景通过 Java → Python HTTP 调用专项 Agent技术选型为什么这么选决策选择原因向量数据库pgvector4C8G 资源有限不想额外部署 Milvus复用 PG 最省资源Agent 编排Spring AI GraphJava业务 Agent 全在 Java 生态编排直接用同栈框架减少跨语言维护成本Python 只用于内容增强等专项场景RAG 检索策略pgvector BM25 混合纯向量检索会丢关键词精度混合检索平衡语义理解和精确匹配Agent 间通信MCP 协议类似微服务的 HTTP/RPC跨语言松耦合独立部署LLMdeepseek-v3性价比优先通过 DashScope OpenAI 兼容接口调用无需本地 GPUAgent 功能概览1. 代码审查 Agent功能上传代码文件或粘贴代码片段 → 双路并行审查LLM 深度分析 本地规则扫描→ 风险评估 → 高风险自动拦截等待人工确认 → 生成结构化报告技术要点Graph 并行编排codeCheckNodeFeign 调用 code-review-agentReactAgent 自我反思迭代审查与 styleCheckNode本地规则扫描并行执行结果汇聚后合并评分自我反思迭代ReflectiveReviewer 模式——审查 → 反思完整性 → 补充遗漏 → Jaccard 相似度判定收敛阈值 0.85避免无限循环浪费 TokenHITL 机制riskAssessNode 评估风险等级CRITICAL 级别存在 CRITICAL issue 或 score60时触发 HumanReviewNode 中断等人工 APPROVED/REJECTED 后继续生成报告Checkpoint 持久化Redis 存储 Graph 状态中断后通过 threadId 恢复61ms 断点恢复典型场景上传一段 Java 代码系统并行跑 LLM 深度审查和本地规则扫描合并评分后判断风险——低风险的直接出报告高风险如检测到 SQL 注入会暂停等待人工确认。不用逐行 review直接看结构化报告处理高优问题。2. RAG 问答系统功能企业级知识库问答支持文档上传、向量检索、流式输出技术要点双路召回pgvector语义 BM25关键词互补检索能力RRF 融合k60把两路检索结果的排名取倒数加权求和解决排序不一致问题DashScope Rerank精排 Top-K 结果进一步提升相关性完整链路文档解析 → 分块策略 → Embedding → 双路召回 → RRF → Rerank → 生成回答典型场景上传一批技术规范文档问Redis 集群的故障转移流程是什么系统从文档中精确检索相关段落生成有据可查的回答而不是大模型凭记忆编答案。3. 个人 AI 搭子功能记住偏好、习惯、历史记录像一个真正了解用户的助手技术要点三层记忆架构L1 结构化记忆规则、事实、状态JDBC 持久化精确匹配L2 向量记忆历史对话的向量存储pgvector语义检索L3 会话记忆会话摘要 待确认项pending queueLLM 辅助压缩上下文Tool Calling动态调用业务接口Agent 不是只能聊天能执行实际操作配额管理Token 消耗追踪 成本控制CompanionUsageService生产环境必需的能力文档摄入支持用户上传文档自动向量化后纳入记忆检索范围典型场景它会记住你的编码偏好、常用技术栈、上次聊到哪了。下次不用重复背景直接接着上次的进度继续。还能调业务接口帮你查数据、触发操作。4. 内容创作 Agent功能完整内容操作系统——素材输入 → 选题分析多候选角度评分→ 大纲生成质量门禁→ 正文生成多平台并行 事实层→ 自动质检不通过自动重试/局部修复→ 封面生成全流程 6 步技术要点5 步创作工作流 封面Orchestrator 模式编排Session 状态机驱动RUNNING → AWAITING_CONFIRM → GENERATING → AWAITING_QUALITY_REVIEW → COMPLETED每步可中断、可回退选题分析TopicSelectionAgent 输出多候选角度 评分支持聚焦模式和全景模式素材量大时自动切换结合 MCP 联网搜索补充素材大纲质量门禁OutlineQualityGate 独立校验大纲质量不通过直接拦截避免低质量大纲进入正文阶段用户可确认/自定义选题角度/切换候选正文生成ContentGenerationAgent 支持多平台并行生成CompletableFuture多平台时自动构建事实层Fact Layer保证核心事实一致素材锚点检查MaterialAnchorChecker校验正文是否忠于素材未验证术语自动标注质检自动修复ContentWorkflowQualityChecker 检查 AI 味 / 违禁词 / 字数 / 格式不通过时自动局部修复PartialFix或全文重试QualityRetry减少人工干预搭子快速通道CompanionFastPath 异步模式立即返回 workflowId后台线程跑选题→大纲→正文避免 HTTP 代理 50~60s 超时典型场景粘贴一段技术素材 → 系统推荐 3 个选题角度附评分→ 选一个确认大纲 → 正文自动生成公众号 掘金两个版本 → 质检发现 AI 味超标自动局部修复 → 生成封面图。全程 5 分钟初稿质量可直接用于发布。5. 多 Agent 协作系统功能Java Supervisor 主图实现意图识别 子图分发MCP 协议实现跨语言工具调用技术要点Supervisor 主图JavaIntentRouterNode 判定业务线 → IntentRouteDispatcher 条件边分发 → 三个子图RAG 问答 / 代码审查 / 通用对话 ReAct全部在同一 JVM 内通过 Spring AI Graph 编排零网络开销子图独立迭代每个子图是独立的 CompiledGraph可以单独测试、单独部署Supervisor 主图只负责路由Python 专项能力内容增强质检、BI Text-to-SQL、学习助手等场景由 Python 服务承载Java 通过 HTTP 调用各取所长MCP 协议通信Java 业务 Agent 暴露工具接口通过 MCP 协议供其他 Agent 调用松耦合独立部署典型场景用户问帮我分析这段代码的安全性Supervisor 主图的 IntentRouterNode 识别为代码审查意图条件边路由到 codeReviewSubGraph子图内走并行审查 HITL 流程全程在 Java 进程内完成不需要跨服务调用。6. 更多 AgentAgent核心能力BI AgentText-to-SQL 自然语言查询数据库ECharts 自动生成图表学习助手学期制管理、任务追踪、知识掌握度评估Bug 分析 Agent日志解析、错误定位、修复建议仓库 Agent代码管理、分支管理、PR 审查技术选型 Agent基于项目需求的技术决策辅助工单 Agent与 SaaS 工单系统集成履约 Agent订单履约流程自动化核心技术亮点1. Graph 编排不是简单的 Prompt → Response用状态机编排复杂工作流并行节点CodeCheck 和 StyleCheck 同时执行结果聚合减少耗时条件分支根据风险等级动态决定是否需要 HITL 人工审核Checkpoint 持久化中断后可恢复不丢状态生产环境必备子图复用Supervisor 主图路由到子图子图可独立测试和迭代这是 Agent 和普通 Prompt 调用的核心区别——工作流可控、可观测、可恢复。2. RAG 系统三层架构保证检索质量不是单一的向量检索而是三层递进双路召回pgvector语义 BM25关键词互补检索盲区RRF 融合解决两路排序不一致k60Rerank 精排DashScope Rerank 重排 Top-K实际测试中混合检索 Rerank 相比纯向量检索准确率提升显著尤其是包含专有名词、编号等场景。3. MCP 协议解耦Agent 不是单体Java 业务 Agent 暴露工具接口其他 Agent 通过 MCP 调用松耦合各自独立部署、独立迭代这是微服务架构思想在 Agent 领域的应用。每个 Agent 是一个独立服务通过标准协议通信而不是一坨代码混在一起。4. 成本控制4C8G 跑 14 个 Agent推理全部调用云端大模型 APIdeepseek-v3不做本地推理无需 GPU向量存储pgvector 复用 PostgreSQL省掉独立向量数据库的资源开销缓存策略Redis 管理 Checkpoint 和配额避免重复计算整体成本阿里云 ECS 大模型 API 调用个人开发者可承受为什么值得看✅ 真实上线不是 Demo14 个 Agent 全部部署在 4C8G 阿里云 ECS 上HTTPS 公网访问有真实用户在使用。每个 Agent 的功能和交互都是经过实际验证的不是纸上谈兵。✅ 4C8G 跑 14 个 Agent成本可复现不是用 8 卡 A100 跑实验。一台普通的阿里云 ECS通过合理的架构设计云端推理 pgvector 复用 Redis 缓存承载 14 个 Agent 的完整运行。个人开发者完全可以复现。✅ 工程化设计不只是写代码每个 Agent 都有完整的工程链路需求分析 → 架构设计 → 核心代码 → 部署踩坑 → 运维监控。从用户旅程到技术选型从性能优化到成本控制覆盖 Agent 落地的完整生命周期。✅ Java 技术栈融入企业架构Java 在企业级应用中有成熟的生态Spring Boot、微服务、中间件。用 Java 做 Agent 能直接融入现有企业架构不需要另起炉灶。Agent 编排用 Spring AI Graph 同栈实现Python 只在专项能力场景使用——务实选型不教条。系列文章结构每个 Agent 一篇独立文章统一结构章节内容需求分析痛点分析、目标功能定义、用户旅程设计架构设计技术选型决策过程、架构图、数据流设计核心代码关键实现逻辑、核心代码片段、设计模式选择踩坑实录真实遇到的问题、排查过程、解决方案技术要点该模块的深度解析、性能数据、优化思路你可能关心的问题Q需要 GPU 服务器吗A不需要。推理全部调用云端大模型 APIdeepseek-v34C8G CPU 服务器即可运行所有 Agent。Q整套系统成本多少A主要成本是阿里云 ECS4C8G 大模型 API 调用费用。没有 GPU 开销pgvector 复用 PostgreSQL 省掉了独立向量数据库的成本。具体成本在后续文章中有详细拆解整体来说个人开发者可以承受。Q能复用到我的实际项目吗A可以。架构模式和核心代码可直接复用。RAG 混合检索、Graph 编排、MCP 协议解耦、三层记忆架构这些方案都是通用的不绑定特定业务。只要你的项目是 Spring Boot 技术栈大部分设计可以直接借鉴。Q为什么用 Java 做 Agent 而不是 PythonA务实选型。Java 在企业级应用中有成熟的生态Spring Boot、微服务、中间件用 Java 做 Agent 可以直接融入现有企业架构。Agent 编排用 Spring AI Graph 同栈实现Python 只在内容增强/BI 等专项场景使用——哪个合适用哪个不教条。Q适合什么阶段的人看A有 Spring Boot 基础、想了解 AI Agent 工程化的开发者。如果你已经熟悉 LangChain/LangGraph可以直接跳到自己感兴趣的文章看核心代码。纯 AI 算法方向的同学可能不太适合这个系列偏工程实践。系列预告本系列将逐篇拆解每个 Agent 的完整实现已规划的文章包括 代码审查 AgentGraph 并行编排 HITL 机制 ReflectiveReviewer 自我反思迭代 RAG 问答系统混合检索 RRF 融合 Rerank 精排全链路 个人 AI 搭子三层记忆架构 Tool Calling 配额管理✍️ 内容创作 Agent5 步工作流编排 多平台并行生成 质检自动修复 多 Agent 协作Java Supervisor 主图 子图分发 MCP 协议 BI AgentText-to-SQL 自动图表生成️ 更多业务 Agent工单、履约、Bug 分析、仓库管理...后续持续更新...有问题评论区见欢迎交流~标签Java、Spring Boot、Spring AI、Spring AI Graph、AI Agent、RAG、MCP、微服务、架构设计、工程实践