CSDN x AMD AI 开发者沙龙·智能体工坊:从 Token 到实战,重新认识 AI 开发这件事
大模型下半场拼的是“上下文分层设计”。出品 | CSDNIDCSDNnews最近几年的 AI 潮全世界的开发者对大模型的了解每年都在逐渐加深一个贯穿始终的问题也演变得越来越具体也越来越无法回避大模型很强可它到底什么时候才能真正“替我们把事情做完”从单轮问答到如今的智能体Agent时代软件开发的底层范式正在经历一次无声的重构。开发者的关注点正快速从单纯的“如何写好提示词”升级到如何进行硬核的“系统工程设计”——我们需要对 Token 进行分配与分层上下文管理需要用可复用的 Skills 连接真实业务更需要设计精密的运行 Loop。6 月 13 日由 CSDN 与 AMD 联合主办的 “AI 开发者沙龙·智能体工坊” 顺利举行。活动围绕 Agent 时代下的开发范式变迁聚焦 Token、本地部署、上下文工程、智能体框架、典型应用场景与工程化落地等核心议题邀请来自 OceanBase、DeerFlow、AMD 的技术专家展开系统分享并通过实践工坊带领开发者进一步走向上手实战。坚持“领先半步”AI 原生的研发升级绝不是买两个工具那么简单自 1999 年成立以来CSDN 已经积累了 5300 万开发者成长为全球第二大开发者社区。在 2026 年 AI 大时代下如何赋能开发者和企业的智能化升级CSDN 总编孟迎霞表示在每一个技术跃迁的节点CSDN 始终坚持做“领先半步”的同行者。“如果领先太多技术离实际工作太远就很难真正带来帮助但如果能领先半步就能告诉大家业界正在发生什么未来走向哪里。抬头看天的过程对技术人来说至关重要。”这也是 CSDN 为什么持续投入线下活动、技术报告、专家访谈和研究型内容的重要原因。围绕 AI 大时代下的新变化孟迎霞分享了 CSDN 这几年在开发者生态上的几个关键动作持续夯实开发者社区基础围绕博客、问答、搜索、创作等场景构建内容与知识服务能力与 AtomGit 共同打造开源代码及人工智能社区支持优秀项目成长与生态连接通过《新程序员》、各类技术报告、视频栏目和直播节目持续输出前沿判断成立“奇点智能研究院”面向技术管理者与企业智能化升级需求提供更深层次的研究、连接与咨询服务。今天“人人都是程序员行行都将智能化万物皆可编程”正在成为现实CSDN 也正从内容平台全面升级为开发者生产力平台。为此奇点智能研究院于今年 4 月正式发布了《AISMM 2026 AI原生软件研发成熟度模型白皮书》。孟迎霞指出“一个企业研发团队要真正完成 AI 原生化升级并不是买几个工具那么简单。”这是一项涉及基础设施、知识工程、组织人才和安全治理等多维度的系统工程白皮书正是旨在为企业软件研发的 AI 原生化演进提供一套可量化的坐标系。应用开发的底层是“Token 分配的艺术”作为大模型应用最基础的处理机制Token 常被直观理解为“一个字”或“一个词”。OceanBase 技术专家汤庆指出模型本质上无法直接处理自然语言而是通过 BPEByte Pair Encoding等子词切分算法将文本转化为数字序列。大模型的底层是在已有上下文基础上通过概率建模持续预测下一个最可能出现的 Token。由此汤庆提出了一个核心论断“大模型应用本质上是 Token 分配的艺术。”不管是传统的提示词工程Prompt Engineering还是最新的上下文工程Context Engineering和循环工程Loop Engineering本质上都在解决同一个问题——如何在有限的窗口里把最关键的信息在最合适的位置给到模型。针对长上下文中极易被忽略的“中心衰减”问题汤庆提出未来大模型应用需要一个“可检索、可溯源、可演进”的上下文系统Context SIG。该系统将上下文分层管理原始信息 L0、摘要信息 L1、抽取的知识 Skills L2并创造性地引入了“做梦机制”在系统空闲时让其对现有上下文进行发散推演利用置信度衰减体系自我强化与纠偏最终将零散的上下文沉淀为高价值、可复用的个性化 Skills。真正的 Agent 工程都是在泥坑里踩出来的“智能体并不只是一个‘更会聊天’的模型而是一个以目标为导向的系统。” DeerFlow 核心贡献者姜宁指出Agent 与单体 LLM 的核心区别在于其具备 ReAct 循环Reason 思考、Act 执行、Observe 观察这决定了 Agent 能否稳定地把任务持续推进下去。在 DeerFlow 从 1.0 深度研究Deep Research走向 2.0 通用 Super Agent 的演进中“Skills能力包”成为了一个至关重要的能力解耦层。姜宁表示“大模型负责推理而 Skills 负责连接具体的业务世界。”通过加载不同的 SkillsAgent 可以动态在数据分析、内容创作、代码处理等任务间切换。同时姜宁深入剖析了智能体工程实现中的关键痛点Memory 的长期偏好积累、Sandbox 的隔离环境、以及通过中间结果落盘进行 Context 长度和 Token 消耗的管理。他强调“很多坑比如 Tool Result 过长、上下文爆炸、调用失败如何善后、高并发如何观测、长链路如何容错这些都不是在 PPT 里能学会的而是在真实项目里一点一点在泥坑里踩出来的。”深度参与开源、在真实场景中试错正是开发者成长最快的路径。本地部署才是高频 Agent 的成本唯一解在真实工作流中Agent 的长期落地必须算清楚“算力与成本”这笔硬账。AMD ROCm 软件与方案架构师 Charles Yang 认为“一个精心设计的 Loop有时候甚至比模型本身更重要。”模型只是大脑而负责上下文管理和 Loop 调度的 Runtime才决定了系统运行的稳定性。他横向对比了当前最火热的两大 Agent 路线常驻多通道协作的 OpenManus与强调长期记忆、可自进化的 Hermes。虽然工具生态极大地解放了生产力但随着使用频次上升高频 Agent 正成为一个极其费钱的 Token 耗能黑洞。由于长系统提示词、海量工具调用日志以及多轮循环重试Agent 运行的推理成本会呈几何级放大。基于此“本地部署正在从‘隐私保护’的附加项转变为长期运行 Agent 的‘成本唯一解’。”Charles Yang 介绍依托 AMD Radeon AI PC 的全栈生态其统一内存架构CPU、GPU、NPU 共享大容量显存能有效消除传统跨总线搬运数据的性能瓶颈非常契合 Agent 需要一边做模型推理、一边高频调度工具与文件的序贯决策场景。配合 ROCm 全栈软件协同本地部署正在成为开发者低成本、零门槛玩转 Agent 的刚性选择。智能体工坊实操基于 Radeon Cloud亲手跑通一个本地 Agent随着主题分享结束活动现场也从“听”转向“做”进入本次“智能体工坊”的核心环节。前半场关于 Token、上下文工程、ReAct、Skills、Memory、Tools、本地部署的分享为后续实操搭建起了一条比较完整的理解路径先理解模型如何处理信息再理解 Agent 如何组织任务、调用工具、保留状态最后再进入实际环境体验一套智能体系统如何被搭建和运行。进入 Workshop 后现场氛围也随之切换。Charles Yang 在台上讲解逐步转入具体操作台下不少开发者一边跟随步骤配置环境一边对照前面分享中提到的模型、上下文、工具链和运行机制现场交流明显增多。有人边听边记有人直接打开电脑同步操作也有人围绕部署细节、调用流程和运行结果与身边同伴低声讨论。对于到场参与者而言前半场建立的是认知框架后半场则把这些概念进一步落到实际操作中。在动手过程中Token、上下文、运行时、工具调用这些原本相对抽象的概念也随着环境配置、任务执行和系统运行过程变得更加具体。开发者不再只是“听到”一个 Agent 的工作方式而是开始在实际操作里感受它如何被搭起来、如何运行、又会在哪些环节产生差异。结语随着 AI 应用持续从问答走向执行开发者对智能体系统的关注点也正在从模型能力逐步扩展到系统能力、工程能力与运行能力。如何把模型接入真实工作流如何让智能体具备持续运行和迭代能力正在成为越来越多开发者关心的话题。此次活动通过主题分享与 Workshop 结合的形式为开发者提供了一个从理解 Agent 到体验 Agent 的交流场景。未来围绕 AI 原生开发、智能体工程与开发者生态的讨论也将持续深入展开。