Agent记忆框架:MemPalace、Cognee、Hindsight、memories.ai
概述AI、LLM、Agent实在是太火爆关于为LLM增加记忆能力的研究也层出不穷。参考Agent记忆理论与实现Mem0、MemU、MemOSAgent记忆框架二Memvid、Memary、MemoryOSAgent记忆框架三Zep、MIRIX、Memobase、LightMem、LangMem、A-MEM、MemTool本文继续汇总介绍。Benchmark之前一直遗漏一个关键环节基准测试评估数据集。LongMemEval论文GitHub另外还有V2版本开源在GitHub。一个全面评估聊天助手长期记忆能力的基准测试。该基准测试设计了500个精心策划的问题涵盖五个核心长期记忆能力信息提取、多会话推理、时间推理、知识更新和回避。提出一种统一框架将长期记忆设计分解为索引、检索和阅读阶段的四个设计选择并提出几种优化策略包括会话分解、事实增强键扩展和时间感知查询扩展。评估AI代理长期记忆能力的权威测试框架测试任务类型事实记忆准确性、经验回顾完整性、模式识别能力评估指标体系准确率、召回率、F1分数、响应延迟、内存效率LoCoMoConvoMemMemBenchMemPalace官网开源GitHub55K Star7.2K Fork本地运行的AI长期记忆系统。架构设计创新三层存储结构Wing人物/项目-Room主题-Drawer原始内容的层次化设计本地优先原则数据完全存储在用户本地无API调用需求可插拔后端支持ChromaDB、SQLite、Qdrant、PgVector等多种存储后端MCP服务器集成提供29个MCP工具与Claude Code等工具深度集成技术实现优势无LLM依赖的检索核心检索功能不依赖外部LLM API嵌入式模型自带embeddinggemma-300m等多语言嵌入模型知识图谱支持包含时间实体关系图支持有效性窗口管理存储结构借用记忆宫殿的概念Wing翼是顶层单位如一个项目或一个人Room房间是具体话题如auth-migration、deploy-processCloset壁橱是压缩索引指向原始内容的位置Drawer抽屉是逐字保存的原始对话文本Tunnel隧道做跨翼关联如果不同项目里聊到同一个话题graph层可自动把它们连起来4层渐进式加载的记忆栈L0身份层大概50个Token告诉AI它是谁、服务谁L1关键故事层大概500-800 Token系统自动从所有记忆里挑出最重要的15个时刻按房间分组作为每次AI唤醒时的核心上下文L2按需回忆层只有聊到某个具体话题的时候才加载对应的房间内容大概200-500 TokenL3深度搜索层对整个记忆宫殿做全量语义检索安装pipinstallmempalace mempalace init ~/projects/myapp mempalace mine ~/projects/myappCognee官网Memory开源GitHub17.9K Star1.9K Fork框架的后期之秀专为AI代理构建持久化记忆。能够将原始数据转化为可搜索的智能记忆层并通过向量检索图数据库本体结构的组合使数据既能进行语义相似检索又能进行结构化推理。也提供托管云服务。特点端到端记忆架构将向量存储、图数据库和推理管道整合为统一的记忆引擎使AI代理能从图谱中连贯地检索知识高可定制本体体系支持基于RDF/OWL本体的知识结构定义你可以通过自定义任务与管道来表示特定行业的实体、属性与关系。RDF和OWL是语义网领域的标准化本体语言以特定序列化格式如XML描述领域的知识结构、语义关系与约束多源数据互联能够处理对话记录、文档、图片、音频等30多种数据类型实现多模态信息的记忆构建混合检索能力提供语义相似性查询和知识图遍历查询的混合策略可在查询时同时利用向量匹配和图结构关系良好的生态集成能力支持与广泛的LLM、嵌入模型、结构化输出框架、关系数据库、图数据库、向量数据库的集成。多重存储架构关系存储跟踪文档、数据块以及它们的来源与关联向量存储保存文本嵌入用于语义相似度检索图谱存储记录实体与实体之间的关系这使得Cognee在检索时能够同时使用向量搜索与知识图谱推理形成更强的混合查询能力。不足对开发者要求相对较高需要同时维护向量库、图数据库甚至本体体系项目相对较新文档、生态、工具链仍在快速成长中架构复杂度高于一般Memory方案更适合复杂业务场景核心架构核心组件Tasks最小的数据处理单元如文本到实体/关系的解析Pipelines多个Task组成工作流如一次完整的从输入到图谱完成DataPoints图谱中的一个信息实体即Pydantic模型上层接口数据添加Add使用cognee.add接口将文本、对话、文件等多种数据源导入系统系统会自动切分文档并为后续处理做准备构建知识图谱Cognify调用cognee.cognify后利用内置的抽取任务从已添加的数据中识别实体/关系生成知识图谱语义增强Memify可选在已构建的图谱上运行cognee.memify可进一步利用语义算法对图谱进行丰富和优化混合检索Search使用cognee.search可对构建好的知识图谱发起向量相似度与图遍历等的混合查询返回检索结果importcogneeawaitcognee.add(我叫张伟是公司的销售总监,dataset_nameuser_profile)# COGNIFY构建知识图谱触发LLM实体与关系抽取awaitcognee.cognify([user_profile])# 混合检索向量图resultsawaitcognee.search(公司的销售总监是谁)Hindsight官网开源GitHub16.5K Star944 Fork记忆框架。架构创新在于采用仿生记忆结构模仿人类记忆的三个认知层次世界事实层存储客观、不变的知识体系技术特点静态存储、可验证性、结构化组织示例编程语言特性、协议规范、数学定理设计考量注重准确性和一致性为上层提供可靠的基础经验层记录代理与环境的每一次具体交互过程技术特点动态时序性、上下文完整性、细节丰富示例具体的用户对话记录、任务执行过程、结果反馈设计考量保留原始交互的完整信息为抽象学习提供素材心智模型层从具体经验中抽象出的认知规律和模式技术特点高度抽象、可迁移性、支持推理预测示例用户行为模式、问题解决策略、系统性能规律设计考量实现真正学习过程将具体经验升华为通用知识分层设计的工程优势在于实现渐进式学习机制具体经验可逐步沉淀为抽象的心智模型不同任务可灵活访问相应层次的记忆信息相似经验会被智能合并抽象有效避免存储爆炸问题。核心原理Hindsight定义三种基础记忆操作构成完整的学习循环系统Retain记忆存储将代理的每一次交互完整记录为经验条目Recall记忆检索根据当前任务上下文智能检索相关记忆算法特点自动判断需要哪些层次的信息事实/经验/心智模型检索策略并行执行多维检索确保全面性和准确性返回格式结构化的记忆片段附带相关性评分和置信度Reflect反思提炼定期分析历史经验抽象出心智模型触发机制基于时间窗口或经验积累量自动执行分析算法模式识别、聚类分析、关联规则挖掘更新策略增量式更新心智模型层保持学习连续性采用四维并行检索策略语义检索维度基于向量相似性的语义理解技术实现Transformer编码器生成语义向量优势理解概念相关性、处理语义多样性适用场景开放性问题、创意任务、复杂推理关键词检索维度基于精确匹配的关键词过滤技术实现倒排索引、布尔查询优化优势保证基础准确性、处理专业术语适用场景技术文档查询、代码片段搜索、精确概念定位图关系检索维度基于记忆关联网络的拓扑搜索技术实现图神经网络、关系推理算法优势发现间接关联、支持推理链条适用场景因果分析、决策过程追溯、复杂系统理解时间范围检索维度基于时间相关性的时序分析技术实现时间序列分析、近期性加权优势识别时序模式、处理动态变化适用场景趋势分析、周期规律、近期偏好识别这四种检索策略不是简单的顺序执行而是真正并行协同当前查询 → 语义编码器 → 向量检索 → 初步结果A ↓ 关键词分析 → 倒排索引 → 初步结果B ↓ 图关系分析 → 图遍历 → 初步结果C ↓ 时间分析 → 时序索引 → 初步结果D ↓ [交叉编码器重排序] → 最终排序结果并行检索的工程优势高召回率通过多维覆盖确保准确性通过多维度相互校验提升适应性通过自动权重调整实现。Python SDK集成示例fromhindsightimportHindsightWrapperfromopenaiimportOpenAI clientOpenAI(api_keyxxx)# 创建Hindsight包装器llm_with_memoryHindsightWrapper(base_llmclient.chat.completions.create,hindsight_config{storage:{type:postgresql,url:postgresql://user:passwordlocalhost:5432/hindsight_db,pool_size:10},retrieval_config:{dimensions:[semantic,keyword,graph,temporal],weights:{semantic:0.4,keyword:0.3,graph:0.2,temporal:0.1},top_k:10},learning_config:{reflection_interval:6h,min_experiences_for_reflection:100}})# 后续所有LLM调用自动获得记忆能力responsellm_with_memory(modelgpt-4,messages[{role:system,content:基于我们之前的讨论历史继续分析这个技术问题...},{role:user,content:如何优化Hindsight在资源受限环境下的性能表现}])# 创建团队共享记忆池team_memoryhindsight.create_shared_context(nameengineering-team-memory,description软件工程团队的集体学习记忆,agents[{id:code-reviewer,role:代码质量审核},{id:debug-assistant,role:问题调试助手},{id:design-consultant,role:架构设计咨询}],access_policy{read:all_agents,write:all_agents,admin:[team-lead-agent]})# 各代理共享同一套学习成果code_reviewer.recallteam_memory.create_recall_session(agent_idcode-reviewer)debug_assistant.mental_modelsteam_memory.get_mental_models(categorydebugging)design_consultant.reflectteam_memory.create_reflect_session(priorityhigh)memories.ai官网功能提供Video Chat、Clip Search、Video-to-Text、Video Creator、Video Marketer、AI Hardware等多种Agent支持企业与个人对接自定义场景。企业级场景实时威胁检测、人员轨迹跟踪与跌倒检测安全监控智能剪辑、创意脚本与营销洞察媒体与营销运动赛事分析、球员技术统计体育Large Visual Memory Model灵感来源于人脑记忆的提示—检索—筛选—监控—重构流程共分五大模块Query Model将用户问题或场景线索编码为检索请求Retrieval Model在海量索引中进行粗粒度检索激活相关视频片段Full‑Modal Indexing Selection对候选片段做多模态打标并精筛最关联内容Reflection Model校验召回结果的一致性与准确性冲突时触发重检Reconstruction Model将碎片化记忆整合补全生成人类式连贯输出测评在多项视频分类K400/K600/K700、UCF101、HMDB、检索MSRVTT、MSVD、ActivityNet和问答MVBench、NextQA、Temp Compass基准中刷新SOTA相比OpenAI、Google等模型呈现大幅领先Memories.ai在无限视频上下文能力上远超Gemini或ChatGPT仅受限于计算资源而非模型架构本身