本文基于 Datawhale 开源项目 Agent-Learning-Hub为想从调用大模型 API 走到能做出可靠 Agent 项目的学习者提供学习路线。文章强调 Agent 的核心在于观察、选择动作、调用工具、检查结果并在出错时拉回而非追名逐利。学习重点应放在工程本身如 agent loop、工具调用、RAG、记忆、harness、skills、协议、评测和安全。文章拆解了从最小 Agent Loop 到多 Agent 协作再到技能封装和浏览器操作 Agent 的完整学习路线并提供了 90 天学习安排和常见坑的避坑指南旨在帮助学习者稳扎稳打最终交付一个真实可用的 Agent 项目。本文基于 Datawhale 开源项目 Agent-Learning-Hub 整理。适合想从“会调用大模型 API”走到“能做出一个可靠 Agent 项目”的学习者。最近学 AI Agent 的人很多但真正卡住的地方往往不是“资料太少”而是“资料太多”。今天看到 LangGraph明天看到 CrewAI后天又刷到 AutoGen、MCP、A2A、Browser Agent、Coding Agent。收藏夹越来越厚项目却还是没有跑起来。如果你也有这种感觉先别急着补框架。学 Agent 最重要的不是追名词而是先搞清楚一件事一个 Agent 到底怎样观察问题、选择动作、调用工具、检查结果并在出错时把事情拉回来。这也是 Datawhale 这份 Agent-Learning-Hub 最值得参考的地方。它没有把路线做成“框架大全”而是把学习重点放回了工程本身agent loop、工具调用、RAG、记忆、harness、skills、协议、评测和安全。下面这篇文章就按这条思路把 AI Agent 学习路线拆成一套可以照着执行的教程。一、先说清楚什么是 Agent很多人第一次接触 Agent会把它理解成“更聪明的聊天机器人”。这个理解只对了一小半。聊天机器人主要做一件事你问它答。工作流主要做一件事你提前写好流程它按流程走。而 Agent 要解决的是另一类问题任务不完全确定过程中需要根据观察结果不断调整下一步。举个简单例子。你让普通聊天机器人“帮我调研某个行业”它可能直接给你一段总结。你让工作流系统做调研它会按固定步骤搜索 3 个关键词、抓 5 篇文章、生成总结。而一个更像样的 Agent会先判断任务目标再搜索资料如果结果太泛会改关键词如果发现资料冲突会继续验证如果需要引用会保留来源最后再输出报告。它不是一次性回答而是在做一个循环。这个循环可以简化成四步观察 读取用户输入、当前状态、历史上下文、工具返回结果。思考 判断下一步该回答、该调用工具还是该继续查证。行动 按明确的 schema 调用搜索、文件、数据库、浏览器、代码执行等工具。复盘 看工具结果是否有效决定继续、修正还是结束任务。所以Agent 的核心不是“模型会不会说话”而是它能不能在不确定任务里稳定地做事。这句话很关键。因为很多 Demo 看起来惊艳只是因为模型写了一段漂亮的话但真正能用的 Agent必须能追踪、能复现、能控制风险。二、现在学 Agent主线应该放在哪里Agent-Learning-Hub 里有一个很清醒的判断当前更值得投入的不是老式“角色扮演多 Agent 框架”而是更贴近真实生产力的方向。可以把重点记成五个词。1. Coding Agent比如 Claude Code、OpenAI Codex 这类产品。它们不是只会聊天而是能进入真实代码库读文件、改文件、跑测试、看报错、申请权限、处理上下文压缩。如果你想理解 Agent 如何真正工作Coding Agent 是非常好的样本。因为软件工程场景天然要求闭环不能只说“我改好了”还要能运行、测试、回滚、解释。2. Agent HarnessHarness 可以理解成 Agent 的“工程外壳”。模型只是大脑的一部分真正让 Agent 可用的是外面这一整套系统工具怎么注册权限怎么控制状态怎么保存失败怎么重试上下文太长怎么压缩每一步怎么追踪发布前怎么评测很多时候Agent 能力不是单纯来自模型而是来自这个 harness。3. Personal Agent也就是更接近“个人操作系统”的 Agent。它可能长期运行接入本地文件、浏览器、消息入口、日程、知识库和技能包。这类 Agent 的难点不只是回答问题而是记忆、权限、长期任务、跨应用协作和安全边界。4. Skills / MCP / A2A / ACP这几个词很容易混。简单说Tool 是一个可调用接口比如搜索、读文件、发请求。Skill 是一套可复用流程比如“如何做代码审查”“如何写研究报告”。MCP 让 Agent 标准化连接外部工具和数据源。A2A 让不同 Agent 之间发现、通信和协作。ACP 更偏 Agent 与宿主应用之间的连接协议。如果说模型负责“想”工具负责“做”那 skills 和协议解决的是“能力如何复用、如何连接、如何扩展”。5. Evaluation and Safety这是很多入门教程会轻轻带过但真实项目绕不开的部分。Agent 一旦能调用工具就不只是“说错话”的问题。它可能误删文件、误发邮件、误查隐私数据、误把不可靠内容当证据。所以一个能交付的 Agent 至少要有固定测试集trace 记录成本和延迟统计工具权限边界高风险操作的人类确认prompt injection 和数据泄露防护意识。没有这些Agent 再会说也只是 Demo。三、完整学习路线从 0 到能交付先看一张总图。下面按阶段拆开说。Stage 0先分清边界这一阶段不要写太多代码先把概念分清。你需要能说清楚chatbot 适合什么workflow 适合什么agent 适合什么multi-agent 又适合什么更重要的是要知道什么时候不该用 Agent。如果一个任务流程稳定、规则明确、普通脚本就能完成那硬上 Agent 反而会增加不确定性。这一阶段的产出很简单写一页短笔记回答“我的场景为什么需要 Agent而不是普通 workflow”能回答这个问题再往下走。推荐资料与主要内容Agent-Learning-HubStage 0主要内容原教程对 Stage 0 的要求很清楚区分 chatbot、workflow、agent、multi-agent理解 observe - think - act - observe 的基本循环并知道什么时候不该用 Agent。建议先按这里列出的 todo 自测一遍。AnthropicBuilding effective agents主要内容这篇文章很适合建立第一性理解。它强调大多数场景应先用简单 workflow只有任务需要动态决策时再使用 agent并给出 prompt chaining、routing、parallelization、orchestrator-workers、evaluator-optimizer 等常见模式。OpenAIA practical guide to building agents主要内容偏产品和工程落地视角讲什么时候适合构建 Agent、Agent 由模型、工具、指令、护栏等部分组成以及如何从小场景开始验证价值。Stage 1写一个最小 Agent Loop别一上来就装框架。先自己写一个 50 到 150 行的小 Agent。它只需要做到几件事调用一次 LLM API让模型输出结构化 JSON定义一个工具比如 calculator、search、read_file解析模型的 tool call执行工具把工具结果再喂回模型设置最大步数、超时和错误处理。这一阶段的目标不是功能强而是让你真正理解 Agent 是怎么“转起来”的。如果你跳过这一步后面学任何框架都会停留在“会调 API”但不知道它内部为什么这么设计。推荐资料与主要内容OpenAI DocsFunction Calling主要内容学习如何把工具描述成结构化 schema让模型返回可解析的工具调用参数。重点看“工具定义、参数校验、调用结果回传”这几件事。Anthropic DocsTool use主要内容学习 Claude 的工具调用机制尤其是模型如何请求使用工具、开发者如何执行工具、再把 tool result 返回给模型。适合对比不同厂商的 tool call 设计。Gemini APIFunction calling主要内容Google Gemini 的函数调用文档。建议不要只学一家 API而是横向比较“函数声明、参数类型、调用模式、错误处理”这些共性。ReAct 论文主要内容Reasoning Acting 的经典范式。初学者不用逐字啃论文重点理解“推理轨迹”和“行动调用”为什么要交替出现。Stage 2工具、RAG 与记忆这一阶段开始做一个有实际用途的 Agent。推荐项目是资料研究助手。输入一个主题它可以自动搜索、筛选、总结并输出引用来源。你需要掌握文档如何切块embedding 怎么做如何检索相关内容如何让回答带 citations搜索、数据库、文件、浏览器怎么接成工具工具失败、空结果、重复调用怎么处理短期上下文、会话记忆、长期记忆有什么区别。很多人以为 RAG 只是“向量库 大模型”。但真正难的地方在于怎么让 Agent 不乱引用、不把检索不到的内容编出来、不在工具失败时假装成功。这一阶段做完你应该能完成一个能用的研究类 Agent。推荐资料与主要内容LlamaIndexRAG 入门主要内容系统理解 RAG 的基本链路加载文档、切块、索引、检索、生成回答。适合用来补“知识库 Agent”的底层概念。LlamaIndexAgents主要内容学习如何把 query engine、检索器和外部工具交给 Agent 使用。适合把普通 RAG 升级成“能选择工具的 RAG Agent”。Model Context ProtocolIntroduction主要内容MCP 解决的是 Agent 如何标准化连接外部工具、数据源和上下文。Stage 2 不必深入协议细节但要知道“工具接入”正在走向标准化。mem0 / Letta主要内容两个都适合学习 Agent 记忆层。mem0 更偏记忆组件Letta 更偏 stateful agents 和上下文管理。建议先看它们如何区分用户偏好、事实记忆和任务上下文。GPT Researcher主要内容一个非常接近“资料研究助手”的开源项目。适合学习多轮搜索、资料筛选、引用整理和长报告生成。Stage 3深入学一个现代 Agent Harness到了这里可以开始选一个系统学深。注意不是学十个框架的 Hello World而是选一个现代 Agent 系统把它拆开看。你要找这些东西agent loop 在哪里tool registry 怎么设计permission gate 怎么拦截危险操作session store 怎么保存状态context compaction 怎么处理长上下文trace 如何记录每一步失败时如何重试和恢复。可以研究的方向包括 Claude Code、Codex、OpenClaw、Hermes、LangGraph、hello-agents 等。这一阶段的产出是一个可调试的 agent harness demo。它应该有 README、运行步骤、示例输入输出以及至少一次失败记录。别害怕失败记录。真正的工程能力往往就是从“为什么失败”里长出来的。推荐资料与主要内容Agent-Learning-HubStage 3主要内容原教程在这一阶段列出了 Claude Code、learn-claude-code、OpenClaw、Hermes、LangGraph 等方向。重点不是都学一遍而是选一个系统拆它的目录结构、agent loop、tool registry、permission gate、session store 和 trace。Claude Code Docs主要内容研究 coding agent 产品形态。重点看 CLI 如何进入代码库、如何使用工具、如何请求权限、如何与 GitHub/MCP/hooks/subagents 等能力配合。OpenAI Agents SDK主要内容学习轻量但完整的 Agent SDK 设计agents、tools、handoffs、guardrails、sessions、tracing。适合写一个生产化雏形。LangGraph Overview主要内容学习状态图、可恢复执行、checkpoint、人类介入和长期运行任务。适合复杂流程、审批流、多步任务和需要明确状态管理的 Agent。learn-claude-code主要内容从零复刻 Claude Code-like harness 的开源教程。适合想真正理解 coding agent 内部机制的人。Stage 4多 Agent 是协调不是魔法很多多 Agent Demo 看起来很热闹一个 planner一个 writer一个 critic一个 reviewer大家聊来聊去最后输出一篇报告。但真实项目里多 Agent 的重点不是“角色越多越聪明”而是“职责边界越清楚越可靠”。你需要学习planner / executor / reviewer / router 分别做什么如何定义每个 Agent 的输入输出 schema如何设定停止条件如何避免循环、争论和任务漂移什么时候单 Agent 反而更好。推荐练习做一个research - write - review - revise的小系统。研究 Agent 只负责找资料写作 Agent 只负责成文审稿 Agent 只负责指出证据不足、结构混乱、表达不清修订 Agent 根据意见改稿。这样做才是多 Agent 协作。推荐资料与主要内容Claude CodeSubagents主要内容学习“专用子代理”的思路不同 agent 拥有不同职责、上下文和工具权限。适合理解多 Agent 不是聊天群而是上下文隔离和任务委派。Google Agent Development Kit主要内容Google 的 Agent 开发框架覆盖 agents、tools、sessions、multi-agent、evaluation 和 deployment。适合从框架角度理解多 Agent 协作。LangGraphMulti-agent Systems主要内容学习 supervisor、handoff、network、hierarchical 等多 Agent 组织方式。重点看“谁调度谁、状态如何传递、什么时候停止”。Agent2Agent Protocol主要内容A2A 关注的是不同 Agent 之间如何发现、通信和协作。Stage 4 可以先看概念理解未来多 Agent 不一定都在同一个框架里。AutoGen主要内容经典多 Agent 对话框架。现在不建议把它作为唯一主线但适合了解多 Agent 对话、角色协作和历史演进。Stage 5学习 Skills、协议和能力封装Agent 变强不只是因为模型变强也因为它能复用经验。Skill 就是把一类任务的做法沉淀下来。一个好的 skill 通常包含什么时候使用具体步骤需要哪些脚本或模板如何验证结果失败时怎么处理。举个例子。“写研究报告”不是一个普通 prompt而可以变成一个 skill先确认主题和受众再搜索资料保留来源整理大纲写初稿检查引用生成最终版本。这个流程可以反复复用也可以被版本化、测试和分发。同时你还需要理解 MCP、A2A、ACP 这些协议。它们不是炫技名词而是解决一个实际问题Agent 如何稳定接入外部工具、其他 Agent 和宿主应用。推荐资料与主要内容Claude CodeSkills主要内容学习 skill 的文件结构、触发机制和渐进式加载。重点理解 skill 不是一段 prompt而是可发现、可复用、可版本化的能力包。AnthropicAgent Skills主要内容从更通用的 Agent 视角理解 skills什么时候该封装成 skill、skill 里应该放步骤还是脚本、如何让模型按需加载额外资料。Model Context Protocol主要内容MCP 用来连接工具和数据源。和 skill 的区别是MCP 负责“接进来”skill 负责“怎么做一类任务”。Agent Client Protocol主要内容ACP 更偏 Agent 与编辑器、IDE、应用宿主之间的交互协议。适合理解 Agent 如何嵌入真实软件而不是只在命令行里运行。OpenClaw Skills主要内容适合观察本地个人 Agent 如何组织 skills、系统工具、权限边界和长运行任务。不要只看功能要看它如何把能力变成可复用模块。Stage 6浏览器和电脑操作 AgentBrowser Agent 和普通 API Tool 不一样。API 是结构化的浏览器页面是变化的。你要处理页面加载慢按钮位置变了弹窗挡住内容元素定位失败网页内容和截图不一致平台规则和账号安全限制。这一阶段可以用 Playwright 或 browser-use 做练习。但请记住一个边界只操作公开网页不登录敏感账号不绕过平台规则。浏览器 Agent 很有用但安全边界要比普通工具更严。推荐资料与主要内容Playwright Docs主要内容浏览器自动化基础。重点看 locator、click、fill、screenshot、trace、等待策略。做 Browser Agent 前最好先能自己写稳定的 Playwright 脚本。AnthropicComputer use主要内容学习模型如何观察屏幕、移动鼠标、点击和输入。重点不在炫技而在安全限制、任务边界和人类监督。browser-use主要内容浏览器 Agent 开源项目。适合学习如何把网页观察、动作执行、失败恢复、任务规划组合起来。WebArena / VisualWebArena主要内容真实网页环境下的 Agent benchmark。适合理解为什么网页任务很难页面状态复杂、视觉信息不稳定、任务需要长期规划。Stage 7评测、安全和可观测如果前面几个阶段让 Agent “能做事”这一阶段就是让它“做得可靠”。你需要给 Agent 准备固定测试集而不是每次只看一个漂亮 demo。至少记录这些信息任务是否成功失败发生在哪一步调用了几次工具花了多少 token耗时多久有没有越权风险回答有没有引用依据。建议做一个 eval 表格先写 20 条任务。每次你改 prompt、改工具、换模型、换检索策略都跑一遍。这一步会让你明显感觉到Agent 工程不是玄学它可以被观测、被比较、被改进。推荐资料与主要内容OpenAI Evals主要内容学习如何给模型或 Agent 准备评测集记录期望输出、实际输出和评分方式。重点是把“感觉更好”变成“有数据对比”。LangSmith Evaluation主要内容学习 trace、dataset、experiment、regression testing 等概念。适合做 Agent 调试、回放和版本对比。OWASP Top 10 for LLM Applications主要内容学习 prompt injection、敏感信息泄露、供应链风险、过度授权等安全问题。Agent 一旦能调用工具安全问题就不只是“答错”。AgentBench / SWE-bench主要内容两个典型 benchmark。AgentBench 用来理解通用 Agent 能力评测SWE-bench 用来理解真实 GitHub issue 修复为什么难。Stage 8交付一个真实 Agent最后不要只停在本地 demo。做一个别人能 clone 下来运行的项目。它需要有明确用户明确任务明确成功标准日志和 trace错误重试和超时成本上限权限边界高风险动作人工确认部署方式README 和限制说明。到这一步你才算真正从“学 Agent”走到了“交付 Agent”。推荐资料与主要内容OpenAI Agents SDKTracing主要内容交付前必须能看见每一步。重点看如何记录 Agent 运行轨迹、工具调用、handoff、错误和耗时。OpenAIProduction best practices主要内容上线前检查速率限制、重试、超时、错误处理、监控、成本控制和安全边界。适合作为 Agent 项目的生产化 checklist。FastAPIDeployment主要内容如果你把 Agent 做成 Web API需要理解进程模型、环境变量、反向代理、容器部署和健康检查。Docker DocsGet Started主要内容把 Agent 项目的运行环境封装起来避免“我电脑能跑你电脑跑不了”。README 里最好包含 Docker 启动方式。GitHub Actions Docs主要内容适合做 CI、定时任务、自动评测和发布前检查。一个可交付 Agent至少应该能自动跑 smoke test 或 eval 子集。四、项目阶梯按这个顺序练学习 Agent 最怕只看文章不做项目。如果不知道从哪开始可以按下面这个阶梯练。推荐顺序是第 1 层Calculator Agent只做最小 tool call loop。目标是理解模型如何选择工具、如何接收工具结果。第 2 层Web Research Agent加入搜索、筛选、引用和总结。目标是做出一个真的能帮你查资料的小助手。第 3 层PDF QA Agent学习 RAG、chunk、retrieval、citation。目标是让 Agent 回答你自己的文档。第 4 层Coding Review Agent读取 git diff按风险排序给测试建议。目标是理解 coding agent 的基本工作方式。第 5 层Browser Agent让 Agent 操作公开网页提取信息并处理失败恢复。第 6 层Nano Coding Agent接入 shell、文件编辑、权限控制、session。不要做太大先做一个迷你版。第 7 层Reusable Skill Pack写一个自己的SKILL.md加入脚本、模板、触发条件和 smoke test。第 8 层Multi-Agent Writer做 planner、writer、reviewer 的协作系统重点练职责边界。第 9 层Personal Agent加入记忆、skills、消息入口尝试做一个个人长期助手。第 10 层Production Harness补齐 evals、trace、权限、CI、回放让项目从 demo 走向可维护。每层都不要贪大。真正有效的练习标准是能运行、能复现、能解释。五、给你一份 90 天学习安排如果你每天能拿出 1 到 2 小时可以按下面节奏推进。第 1-14 天把最小闭环跑起来目标只有一个写出最小 Agent Loop。每天做一点第 1-2 天熟悉 LLM API 和结构化输出。第 3-5 天定义 calculator / search / read_file 这类简单工具。第 6-8 天解析 tool call并把工具结果送回模型。第 9-11 天加入最大步数、超时、异常处理。第 12-14 天整理 README写清楚一次完整运行过程。这两周结束你应该不再把 Agent 当成黑盒。第 15-30 天做一个研究助手目标是完成 Web Research Agent。你要学会搜索、抓取、筛选、引用、总结。这段时间重点练三件事第一回答要有来源。第二找不到资料要承认不知道。第三工具失败不能假装成功。这会逼你开始关注 Agent 的可靠性。第 31-45 天补 RAG 和记忆把 PDF、网页、Markdown 文档接入进来。学习 chunk、embedding、retrieve、rerank 和 citations。再加一点记忆能力短期上下文用于当前任务会话记忆用于连续对话长期记忆用于跨任务偏好和事实。不要一开始就做复杂记忆系统。先让它能“记得必要的东西”再考虑长期演化。第 46-60 天拆一个现代 Harness选一个系统学深。可以是 LangGraph、OpenAI Agents SDK、Claude Code 相关学习项目、OpenClaw、hello-agents任选一个。这一阶段不要只看 API。你要画出它的结构入口在哪里状态怎么传工具怎么注册权限怎么过trace 怎么看失败怎么恢复。然后给它加一个自己的工具。第 61-75 天做 skills、协议和多 Agent先写一个 skill。比如code-reviewresearch-reportpdf-extractionrelease-note-writer。然后理解 MCP 的作用让 Agent 用标准方式连接工具和数据源。最后再做一个小型多 Agent 系统。记住多 Agent 的重点是协调而不是让几个角色自由聊天。第 76-90 天加评测、安全和部署最后 15 天专门做工程化。准备 20 条 eval 测试任务记录成功率、失败原因、成本和延迟给危险工具加人工确认写部署文档把项目整理成别人能运行的样子。如果能做到这一步你已经不是“看过 Agent 教程”而是有了一个能展示、能改进、能继续扩展的 Agent 项目。六、几个很常见的坑坑 1一上来就学多 Agent多 Agent 不是入门捷径。如果单 Agent 的工具调用、状态管理、失败处理都没搞清楚多 Agent 只会把问题放大。先做单 Agent再做协作。坑 2只看框架不看 traceAgent 失败时最有价值的信息在 trace 里。它为什么调用这个工具工具返回了什么它为什么又调用了一次哪一步开始跑偏不会看 trace就很难调 Agent。坑 3工具 schema 写得太随意工具不是“给模型一个函数名”就完事。参数要清楚返回要稳定错误要可读权限要明确。工具越随意Agent 越容易乱用。坑 4没有 eval却不断调 prompt没有测试集的 prompt 优化很容易变成玄学。你觉得变好了可能只是刚好命中了一个样例。固定测试集能帮你判断这次修改到底是进步还是只是换了一种失败方式。坑 5忘了判断“是否需要 Agent”不是所有任务都该用 Agent。如果普通脚本能稳定完成就用脚本。如果固定流程能解决就用 workflow。只有在任务有不确定性、需要动态决策、需要调用多种工具时Agent 才真正有价值。七、最后一条最朴素的学习原则学 Agent不要只问“哪个框架最强”。更好的问题是这个 Agent 能不能完成闭环工具调用是否可靠失败能不能定位危险动作有没有权限边界有没有固定评测别人能不能运行我的项目能回答这些问题你的学习就不会被新名词带着跑。从一个 50 行的最小 Agent 开始。再做一个研究助手。再加 RAG、记忆、trace、skills、评测和安全。最后把它整理成一个真实项目。这条路看起来慢但它最稳。因为真正能用的 Agent从来不是靠“角色设定”堆出来的。它是一个能观察、能行动、能复盘、能被约束的工程系统。最后如果说程序员已经是高薪职业那么干AI的程序员就是高薪中的高薪。现在的市场已经用数据给程序员指明了方向学AI大模型就是冲刺高薪的最优解看着身边越来越多的同行转型大模型、拿到高薪offer很多人心里都动了心但真正的难题来了零基础小白不知道从哪入门有基础的程序员找不到系统学习路径实战项目练手无门面试不知道考什么别慌今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包覆盖从入门到实战、从理论到面试、从基础到进阶的全流程所有资料均已整理归档无冗余、无套路免费分享给每一位想抓住AI风口的程序员和小白扫码免费领取全部内容1、大模型系统化学习路线2、大模型学习书籍文档3、AI大模型最新行业报告4、大模型项目实战配套源码5、大模型大厂面试真题四阶段精细化学习规划附时间节点可直接照做结合上述资源给大家整理了一份可直接落地的四阶段学习规划总时长约2个月小白可循序渐进程序员可根据自身基础调整节奏高效掌握大模型核心能力快速实现从“入门”到“能落地、能面试”的跨越。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容6、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】