八个主流Agent记忆系统的详细对比梳理
我们整理了ContextDB、Memora、MemForest、RMM、MPR、A-MEM、HyMem将对这些项目进行比对包括核心思想、关键创新、性能数据、适用场景和开源地址等维度。一、总览对比表项目出处核心思想关键创新性能数据开源地址对14B适配度ContextDBZenodo 2026统一记忆操作系统RL训练的Memory Manager多图表示Token节省90%P95延迟100msApache 2.0⭐⭐⭐⭐⭐MemoraMicrosoft/ICML 2026谐波记忆表示存储与检索解耦Token节省98%LoCoMo/LongMemEval SOTAgithub.com/microsoft/Memora⭐⭐⭐⭐⭐MemForestarXiv 2026分层时序索引MemTree树状索引并行块提取79.8% pass1吞吐量6倍于SOTA未明确⭐⭐⭐⭐EngramarXiv 2026双时态知识图谱无效化而非删除混合检索83.6% vs 73.2%全量8倍Token节省github.com/ly-wang19/engram⭐⭐⭐⭐⭐RMMACL 2025前瞻回溯双通道反思前瞻反思在线RL优化检索LongMemEval提升10%未明确⭐⭐⭐MPRarXiv 2025元策略记忆谓词规则软约束硬约束双机制无需模型权重更新未明确⭐⭐⭐⭐⭐A-MEMNeurIPS 2025Zettelkasten卡片盒法记忆主动建立链接动态演化超越现有SOTAgithub.com/agiresearch/A-mem⭐⭐⭐⭐HyMemICML 2026认知经济 双层检索简单查询走轻量复杂走深度计算成本降低92.6%未明确⭐⭐⭐⭐⭐二、各方案详细解读1. ContextDB统一记忆操作系统核心问题当前每个Agent团队都在拼凑同一套脆弱补丁——向量库存Embedding、Redis存会话状态、PostgreSQL存用户画像、再加一堆胶水代码。三大统一三种记忆形式Token级原始文本、参数化模型权重、隐式推理轨迹三种记忆功能事实性世界知识、经验性交互历史、工作性当前上下文三个动态过程形成Formation、演化Evolution、检索Retrieval关键创新多图记忆表示将语义、时序、因果、实体四个维度解耦支持查询自适应检索RL训练的Memory Manager仅需150个训练样本学会最优记忆操作ADD/UPDATE/DELETE/NOOPSegment-Level压缩管道“压缩即去噪”策略检索精度提升最高18%多Agent记忆共享协议带冲突解决和角色感知路由落地指标P95召回延迟100msToken节省最高90%对14B的价值Memory Manager是RL训练的轻量级模型不依赖大LLM做决策。记忆形成的压缩管道可离线运行14B只需在检索阶段参与。开源状态Apache 2.02. Memora谐波记忆表示微软/ICML 2026核心问题现有记忆系统被迫在特异性保留细节和抽象性高效组织之间做取舍。核心洞察把“存什么”和“怎么查”解耦。Rich Memory Content丰富记忆内容存完整的、带细节的记忆Lightweight Abstractions轻量抽象为每条记忆生成轻量级摘要和线索锚点Cue Anchors检索时先查轻量抽象定位相关记忆再按需加载具体内容性能数据LoCoMo和LongMemEval新SOTA超越Mem0、RAG和全量上下文推理Token消耗减少高达98%对14B的价值“存细节查抽象”模式记忆提炼可用更重的模型离线做一次而在线检索只需要轻量匹配——14B只负责“查”不负责“提炼”。开源地址https://github.com/microsoft/Memora3. MemForest分层时序索引核心问题现有系统受限于粗粒度的状态管理和顺序化的更新管道——每次更新都要重写整个状态延迟随记忆积累不断增长。关键创新并行块提取Parallel Chunk Extraction打破顺序瓶颈记忆构建变成并发独立操作MemTree分层时序索引把记忆组织成时间有序的树而非扁平的全局摘要。用局部化的逐节点更新替代全量重写维护成本降到只影响受影响的树路径性能数据LongMemEval-S上79.8% pass1准确率记忆构建吞吐量比EverMemOS等SOTA方法高约6倍对14B的价值树状索引意味着记忆更新是局部的、增量的不需要每次都用LLM重做全局摘要。离线构建一次树结构在线只做增量插入和局部更新。4. Engram双时态记忆引擎核心问题大多数记忆系统在成本/延迟上赢了但在准确率上仍然输给全量上下文基线。架构设计快速写入路径无损追加情节LLM不在关键路径上异步提取路径提取原子事实主语-谓语-宾语构建双时态知识图谱用无效化Invalidating而非删除解决冲突——每个事实都保留来源和取代链混合读取路径融合稠密向量、词法、图谱、时效性/显著性多路信号加上时间点As-of过滤器组装紧凑的带来源标签的上下文性能数据LongMemEval_S上用约9.6k Token的检索切片而非79k全量历史得分83.6% vs 73.2%全量上下文高出10.4个百分点Token节省约8倍对14B的价值“双时态图谱混合检索”完全不依赖LLM做实时提炼——提取事实是异步的检索是传统索引向量混合。14B只需要消费最终组装好的上下文。开源地址https://github.com/ly-wang19/engram5. RMM前瞻回溯双通道反思ACL 2025核心问题现有反思机制是事后Retrospective的——出了问题才反思。RMM增加前瞻Prospective通道。双通道设计前瞻反思Prospective Reflection动态跨粒度话语→轮次→会话总结交互构建个性化记忆库供未来检索回溯反思Retrospective Reflection基于LLM引用的证据以在线强化学习方式迭代优化检索性能数据LongMemEval上比无记忆管理基线提升超10%准确率对14B的价值前瞻反思可以离线批量做用现有缓存数据回溯反思的RL优化可以慢慢迭代。14B只需在检索时配合。开源状态未明确论文已发表于ACL 20256. MPR元策略反思arXiv 2025核心问题Reflexion等反思策略产生的反思是临时的、任务特定的不能在任务间复用。核心机制把LLM生成的反思转化为结构化的、谓词式的元策略记忆Meta-Policy Memory, MPM带置信度权重在线维护和更新这个记忆双机制应用软约束Soft Memory-Guided Decoding通过Prompt注入规则引导生成硬约束Hard Rule Admissibility Checks, HAC执行前强制检查阻止不安全或无效动作核心价值不需要模型权重更新强制领域约束减少不安全动作保留语言反思的适应性对14B的价值MPM是结构化数据谓词形式不需要LLM反复推理。14B只需在执行前做硬约束检查纯代码逻辑在执行中接受软约束引导Prompt注入。把反思结果变成可执行规则而不是每次重新反思。开源状态未明确7. A-MEMZettelkasten式记忆网络NeurIPS 2025核心问题当前记忆系统的操作和结构是固定的无法跨任务自适应。核心思想借鉴德国社会学家Niklas Luhmann的Zettelkasten卡片盒笔记法。工作机制新记忆加入时生成包含上下文描述、关键词、标签的结构化笔记系统主动分析历史记忆识别相关连接建立有意义的链接记忆演化新记忆的加入可以触发对旧记忆的上下文表示和属性的更新性能数据在六个基础模型上超越现有SOTA基线对14B的价值记忆链接和演化可以离线批量进行。14B只需在检索时遍历图结构。开源地址评估代码https://github.com/WujiangXu/AgenticMemory系统代码https://github.com/agiresearch/A-mem8. HyMem混合记忆架构ICML 2026核心问题现有方法在效率和效果之间存在根本性权衡——记忆压缩会丢失关键细节保留原始文本又带来不必要的计算开销。核心思想受认知经济Cognitive Economy原则启发。双粒度存储 动态双层检索轻量模块构建摘要级上下文用于高效响应生成LLM深度模块仅对复杂查询选择性激活配合反思机制做迭代推理精化性能数据超越全量上下文同时降低92.6%计算成本对14B的价值核心理念是**“简单查询走轻量路径复杂查询才动用LLM”** 。大部分查询根本不需要14B做深度推理直接用摘要级上下文就能响应。开源状态未明确三、综合对比各维度排名维度第1名第2名第3名Token节省效率Memora98%HyMem92.6%ContextDB90%检索精度Engram83.6% vs 73.2%MemForest79.8%ContextDB18%提升写入效率MemForest6倍于SOTAEngramLLM不在关键路径ContextDBRL Manager对14B友好度MPR纯规则无LLM依赖Engram异步提取HyMem简单查询不走LLM记忆演化能力A-MEM主动链接更新ContextDB三动态过程Memora抽象细节双轨开源可用性ContextDBApache 2.0MemoraGitHubA-MEM双GitHub