第7章 记忆系统与长短期上下文管理“记忆是智能的基石——没有记忆的Agent只是一个无状态的函数,有了记忆的Agent才是一个有人格的伙伴。”章首导读如果你问一个资深Agent开发者:"做Agent最难的是什么?“十有八九会告诉你两个答案:一是工具调用的可靠性,二是记忆管理。前者是"手"的问题,后者是"脑"的问题。手抖了可以重试,脑子乱了却会让Agent彻底变成一个"金鱼脑”——每隔三秒忘掉一切,反复问你同一个问题,把对话变成一场西西弗斯式的折磨。记忆系统是Agent架构中最容易被忽视、却最致命的组件。很多团队在原型阶段把全部对话历史塞进context window,跑通了Demo就觉得万事大吉;等上线后用户聊到第20轮,token费用飙升、延迟暴增、模型开始"幻觉式遗忘"——明明用户三句话前说过自己是M码,Agent转头又问"请问您穿什么尺码?"——这才意识到记忆管理是一个需要严肃工程化的系统级问题。本章将从认知科学的记忆分类出发,系统性地剖析Agent记忆系统的全景:从短时记忆到长时记忆,从context window到向量库,从记忆的写入、检索、压缩到遗忘,从MemGPT的分页调度到Zep的图记忆,从电商导购的"记住尺码"到GDPR的"被遗忘权"。我们不仅讲原理,更讲工程落地;不仅给面试题,更给踩坑经验。本章适合以下读者:面试AI Agent开发平台