01 双编码器与交叉编码器-尧图建网站

自己的感悟RAG检索增强生成并非一个新技术只是对于原有搜索算法在不同场景和技术的升级。举个例子百度和gogle作为一个搜索引擎同样采用了bm25和tf-idf等传统匹配算法。只是随着最近大语言模型的发展多了一个增强生成的阶段和更细粒度的拆分。Bi-Encoder vs Cross-Encoder这里需要理解两种编码器的区别Bi-Encoder双编码器query 和 chunk 分别编码成向量然后计算向量相似度。这就是 Embedding 模型的工作方式。优点是速度快可以提前把所有 chunk 编码好存起来查询时只需要编码 query缺点是精度有限因为 query 和 chunk 是独立编码的无法捕捉它们之间的细粒度交互关系。Cross-Encoder交叉编码器把 query 和 chunk 拼接在一起比如[CLS] query [SEP] chunk [SEP]一起输入模型模型能看到 query 和 chunk 的完整交互输出一个相关性分数。优点是精度更高能捕捉更细粒度的语义关系缺点是速度慢每个 (query, chunk) 对都要过一遍模型。重排序通常用 Cross-Encoder因为候选集已经很小了比如 20~50 个可以接受慢一点的速度换取更高的精度。实际上双编码器是将数据隐射到一个高维的坐标系中通过一个多维度向量表示然后通过一些距离算法计算匹配度。而交叉编码器是通过数据进入 Transformer 编码器后Attention 机制会计算序列中每一个 Token 与其他所有 Token 的关联权重。Query 这边的“苹果”可以直接“看到”Chunk 那边的“水果”和“一种”同时 Chunk 那边的“水果”也能看到 Query 这边的“好吃”。它捕捉了所有词与词之间两两的交互关系。所以交叉编码器比双编码器计算的相似度更加准确。双编码器先压缩降维成向量后交互算距离。交互发生在压缩之后用的是残缺的、丢失了细节的“压缩包”去碰运气。交叉编码器先交互全注意力后压缩输出分数。在交互阶段512 个 Token 完整保留带着所有细节去和 Query 的每一个字进行“全场一对一辩论”。直到辩论结束模型掌握了所有细微线索后才在最后一层通过[CLS]将其压缩成一个分数。为什么不直接用 Cross-Encoder 做检索你可能会问既然 Cross-Encoder 精度更高为什么不直接用它做检索还要搞两阶段因为太慢了。假设你的知识库有 100 万个 chunk用户提问时你需要把这 100 万个 chunk 逐个和 query 拼接起来过 Cross-Encoder这需要 100 万次模型推理延迟和成本都不可接受。所以工程上一定是两阶段策略1.粗检索Bi-Encoder快速从 100 万个 chunk 中召回 Top-20 或 Top-50延迟低覆盖面广2.精排序Cross-Encoder对这 20~50 个候选逐个打分延迟可接受精度高这就是快召回慢精排的核心思想。注意嵌入向量生成其实比rerank慢很多两三倍的差距但是生成嵌入向量后再进行相似度计算所需要的时间只有交叉编码器生成的百分之一

相关新闻

【Java毕业设计】校园在线测验考试成绩管理系统的设计与实现 智能题库组卷与在线考试监控系统(源码+文档+远程调试，全bao定制等)

AI写小说接入文心一言教程：千帆API+向量记忆系统实现百万字长篇智能创作

OpenCV 4.8 形状检测实战：5步预处理与3种轮廓近似方法对比

最新新闻

剪映、PS C盘占用几十G怎么办？我用一个工具，5分钟多出23G

UTBotJava多语言支持指南：Java、Kotlin、Python、Go、JavaScript全覆盖

企业网络管理实战：稳定、安全、高效运维全方案

MIX 11 细节梳理 Windows phone 7 Session

Windows Phone 7重量级版本升级 - Mango （芒果）

天学网英语听力对孩子有用吗？2026最新实测给家长靠谱答案

日新闻

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

周新闻

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

月新闻

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

【Java毕业设计】校园在线测验考试成绩管理系统的设计与实现智能题库组卷与在线考试监控系统(源码+文档+远程调试，全bao定制等)