22 从零写一个最小可用 RAG 系统
专栏:大模型应用开发:从原理到生产篇号:22内容标签:RAG、OpenAI、Chroma、向量检索、AI应用开发前面几篇,我们已经把 RAG 的关键部件拆开讲了一轮。第 17 篇讲 RAG 解决什么问题。第 18 篇讲完整 RAG 系统包含哪些环节。第 19 篇讲文档解析与分块。第 20 篇讲 Embedding 与向量检索。第 21 篇讲向量数据库怎么选。现在该把这些东西串起来了。这一篇不追求生产级架构。目标只有一个:写一个最小可用的 RAG 系统,让你完整看见“文档 → 检索 → 回答”这条链路。为什么强调“最小可用”?因为很多人第一次做 RAG,很容易一上来就想太多:要不要接 PDF 解析?要不要支持多租户?要不要加 Rerank?要不要做混合检索?要不要支持权限?要不要接 LangChain 或 LlamaIndex?要不要上 Milvus?这些问题都重要。但第一步不是把所有能力一次做完。第一步是确认最基本的闭