字节二面被问：“工作记忆在 Agent 执行任务时，究竟承担什么角色？“，我说：“临时储存信息的地方“,他说：“这么说没错，但是不全面...“-尧图建网站

前段时间有个粉丝去面字节的Agent方向岗位二面的时候面试官问了他一个问题“你觉得工作记忆在Agent执行任务的时候究竟承担什么角色”他想了想给了一个大多数人都会说的答案“就是临时储存信息的地方嘛。”面试官听完笑了笑点点头说“这么说没错但是不全面。”他有点懵不知道该怎么往下接。面试官又换了个角度问他“那你说说如果Agent同时收到一段文字投诉、一张破损商品图片、还有一段语音留言工作记忆在这个过程里具体做了什么”他挠了挠头说“就是……先把它们存起来”面试官没有直接否定只是问了一句“那存起来之后呢Agent怎么决定先看哪个、忽略哪个怎么把三路信息整合成一个判断”他愣了一下意识到自己从来没认真想过这个问题。他以为工作记忆就是个临时缓存没想到它还有筛选、推理、规划这些主动作用。这个问题其实很多人都没答好今天展开讲。✦ ✦ ✦1. 感知输入的暂存与筛选字节面试官问的这个问题其实挺有代表性的。大多数人第一反应就是临时储存信息的地方这个答案不能说错但确实没有说到点子上。问题出在哪呢。就是这种表述把工作记忆给降格了降格成一个被动的容器了。就好比你给水管装了个蓄水池似的。但真正让面试官感兴趣的是什么呢是你能不能从认知科学的角度把它的四重主动作用给说清楚。哪四重呢就是筛选、推理、规划、装配。这四件事啊每一件都不是被动发生的。先来说第一层吧。就是感知输入的暂存与筛选。你不妨想象一下字节面试官问的那个场景。就是用户同时给你发来了一段情绪很激烈的文字投诉还有一张破损商品的图片另外还有一段语音留言。这三股信息同时涌进来了Agent 面临的第一个问题是什么呢。不是怎么回复而是该看什么、该忽略什么。这恰恰就是工作记忆介入的时机。它就像一道选择性的滤网一样。文本里面的语气助词呢就被过滤掉了。图片里面破损的具体位置呢就被放大标注出来了。语音里面的那些关键诉求呢就被单独提取出来了。这里有个细节值得我们注意一下。就是工作记忆和短期记忆这两个概念在日常语境里面经常被混着用。但是认知心理学家 Alan Baddeley 在 1974 年提出工作记忆理论的时候特意把它们做了区分。短期记忆呢只是短暂保存信息。而工作记忆呢是在保存的同时还进行加工。这个加工两个字啊才是关键所在。换句话说呢要是没有这一层过滤机制的话Agent 在处理图像的时候它最初接收到的那些文字信息可能就已经悄悄消散掉了。这样的话它就没办法把三路信息整合成一个完整的判断。✦ ✦ ✦2. 推理的演算草稿纸面试官追问的存起来之后呢其实就是在问这第二层。当 Agent 在判断这笔订单是不是满足退款条件的时候它需要同时去对照好多条规则。先从长期记忆里面把售后政策给调出来然后再拿来和当前的订单信息进行比对。这个同时摆在台面上看的动作呢就是工作记忆在做的事情。认知科学里面有个很经典的概念。就是 George Miller 在 1956 年提出来的那个7±2 法则。这个法则是说人类工作记忆一次大概能处理 5 到 9 个信息单元。后来的研究修正得更保守一些认为真实有效的容量大概只有 4 个组块英文叫 chunk。Agent 的上下文窗口本质上是同一个道理只不过粒度换成了 token。在推理这个阶段呢用户信誉良好和商品破损属实这两条中间结论会被暂时挂在工作记忆里面等着被纳入最终判断。它们不是最终答案而是下一步推论的跳板。值得一提的是啊这和人类思考的时候草稿纸的作用是非常相似的。你在解数学题的时候中间步骤写在纸上不是为了给别人看的而是为了留住你下一步还需要用到的东西。Agent 的工作记忆呢本质上就是这么一张数字草稿纸。✦ ✦ ✦3. 规划的推演沙盘第三层比第二层更有意思。它不只是现在是什么状态而是如果我这样做会怎么样。Agent 生成了两个候选方案。一个是直接退款加道歉另一个是只补一张优惠券。接下来呢它要在工作记忆里面分别去推演这两个路径的后果这样才能选出那个代价最小、收益最大的选项。这个零成本试错的过程呢就是规划能力的核心。退款方案的直接成本是 50 块钱但是能挽留住一个高价值的用户综合风险权重比较低。优惠券方案呢钱是省了但可能会让用户投诉升级长期损失反而更大。这两套账啊都是在工作记忆里面算出来的不是调用外部工具去算的也不是等到真正执行完了才知道结果。有趣的是什么呢就是这跟棋手在落子之前的思考方式几乎是同构的。不是随机去试错而是在脑子里面同时维持多个假设状态然后逐一去评估代价再做决定。Agent 在工作记忆里面做的呢正是这种受控的假设推演。✦ ✦ ✦4. 行动与验证的装配车间方案选定之后呢最后一层就是把结论变成可以发送出去的内容。这封回信需要同时包含三个部分。一个是有温度的道歉语句一个是退款订单的链接还有一个是赔偿说明。这三个组件各自有语气、有格式要求还得互相配合读起来要像一个人说的话而不是三段话拼凑在一起。工作记忆在这里充当的呢就是装配线上的组装台。但是这个台子它是有面积上限的。如果输入的信息太多了早先暂存的那些内容就会被新内容给挤出去。道歉语句还没写完呢链接就覆盖进来了。最终发出去的呢可能就是一封语义断裂的、让用户更加愤怒的回复。这正是工作记忆最核心的工程约束。它既是引擎也是瓶颈。✦ ✦ ✦关于瓶颈这件事呢值得多说两句。ChatGPT 刚推出来的时候上下文窗口只有 4000 个 token。到了 2025 年呢主流模型已经普遍支持 128K token 了部分前沿模型甚至突破了百万 token。但是窗口变大了并不意味着问题就消失了。研究发现啊随着上下文变长模型在中间位置的信息上面准确率会明显下降这个现象被称为上下文衰减。换句话说呢工作记忆越大不一定就越好用。管理它的策略呢才是真正的技术难点。目前工程上的主流解法是什么呢就是引入注意力筛选机制来压缩高价值的信息然后再配合 RAG也就是检索增强生成把重要的结论写入外部的长期记忆里面。需要的时候再检索回来。这就是工作记忆和长期记忆之间那条双向通道存在的意义。不是简单地存和取而是在每次任务中动态地去决定什么值得被记住、什么可以被丢弃。✦ ✦ ✦回到面试现场吧。如果你只是说工作记忆就是个临时记事本的话呢这道题就已经答完了而且是答错了。真正的回答应该是怎样的呢应该是把它的四层作用展开来讲。就是感知过滤、推理草稿、规划沙盘、装配验证。并且还要能指出它的核心矛盾就是它既是 Agent 思维的舞台也是制约 Agent 能力上限的瓶颈。在我看来呢理解工作记忆最关键的一点不是它能装多少而是它在装满之前能做多少有意义的事情。这个维度呢才是区分一个会用 Agent的工程师和一个理解 Agent的架构师之间真正的分水岭。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关新闻

【算法打卡】LeetCode 142. 环形链表 II（双指针数学证明）

Claude API 并发请求失败率高？队列和限速可以这样设计

FastAPI 新手入门第 6 篇：重复代码太多时——依赖注入能解决什么

最新新闻

前端工程化的演进：从 Grunt 到 Vite

DGX Spark 与采集卡通信

Java计算机毕设之轻量化网络域名运维服务平台的设计与实现 基于 Web 的企业域名资产管控系统设计与实现(完整前后端代码+说明文档+LW，调试定制等）

翡翠不是越绿越值钱！耳饰选色指南

刷屏全网的蛋挞小姐姐 藏着科技最温柔的力量

2026免费去水印工具推荐：短视频网页手机电脑全平台无广告教程

日新闻

如何在1分钟内为Windows安装苹果USB网络共享驱动：完整解决方案

专业级Windows系统优化工具：WinUtil一站式自动化解决方案

液冷板焊接的能耗账：钎焊炉一年200万度电，激光产线只花十分之一

周新闻

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

月新闻

Java计算机毕设之轻量化网络域名运维服务平台的设计与实现基于 Web 的企业域名资产管控系统设计与实现(完整前后端代码+说明文档+LW，调试定制等）

刷屏全网的蛋挞小姐姐藏着科技最温柔的力量