Karpathy LLM Wiki 完整原理与双方案部署教程Cursor / Claude 通用标签#LLMWiki #Karpathy #AI知识库 #Cursor教程 #Claude教程 #替代RAG前言Andrej Karpathy 最新提出的LLM Wiki是目前替代传统 RAG 的下一代个人/团队知识管理范式。它彻底抛弃向量数据库、文本分片、实时检索等复杂链路依靠「三层文件夹结构大模型自主编译维护」实现知识复利、结构化沉淀、零运维、极低 Token 消耗。很多人误以为 LLM Wiki 只能用 Claude这是最大误区。本文拆解核心底层原理并提供两套可落地的生产级部署方案✅方案一Cursor 部署GPT-4o / 4o-mini / 本地模型通用最适合普通开发者✅方案二Claude 原版部署贴合 Karpathy 原始设计超长文本最优解全文无废话、可直接跟着搭建专属永久知识库。一、LLM Wiki 核心原理彻底看懂为什么吊打传统 RAG1.1 核心定义LLM Wiki 不是工具、不是插件是一套AI 知识编译架构。传统 RAG提问时临时分片、临时检索、临时拼接答案知识碎片化、无沉淀、重复消耗 Token。LLM Wiki先编译、后查询、持续迭代。AI 一次性读完所有原始资料蒸馏、归类、建链、生成结构化维基页面后续所有问答直接复用编译好的完整知识体系。1.2 三层核心架构LLM Wiki 灵魂整套架构仅由三层组成极简且高度规范所有模型通用第一层raw 原始数据源人类专属、只读不可改存放所有原始资料PDF、笔记、文档、网页摘录、论文、学习素材。核心规则raw 文件夹只增不改、只进不出永久保留原始证据保证所有知识可溯源、无篡改。第二层wiki 结构化知识库LLM 专属、全权维护AI 自动生成、自动更新、自动维护的知识维基库全部为标准 Markdown 文件。包含概念解释、知识总结、双向内链、关联图谱、分类目录、溯源引用。核心价值把零散原始素材变成结构化、可关联、可迭代、可复利的体系化知识。第三层规则配置层CLAUDE.md / Cursor Rules很多人误解CLAUDE.md 只是规则文件名不绑定 Claude 模型。它是给 AI 的「工作手册」定义整套 Wiki 的生成规范、页面格式、权限约束、更新逻辑、巡检规则。- Claude 部署直接使用 CLAUDE.md- Cursor 部署可兼容 CLAUDE.md也可迁移为 Cursor 原生 .cursor/rules 永久规则1.3 三大核心工作流完整闭环① Ingest 知识编译入库一次性蒸馏新增素材放入 rawAI 批量读取、去重、合并、提炼、建双向内链、生成 Wiki 页面自动更新全局目录。相当于 AI 帮你读完所有资料并整理成结构化读书笔记。② Query 智能问答复用知识调用基于已编译的完整 Wiki 知识库回答问题无需重复读取原始素材。优质问答结果自动沉淀为新 Wiki 页面实现知识越用越多、越用越精准。③ Lint 全局巡检规整自动维护AI 定期全局扫描 Wiki 库修复失效内链、合并重复页面、统一格式、更新目录、清理冗余彻底解决个人笔记越堆越乱的痛点。1.4 LLM Wiki vs 传统 RAG 核心对比对比维度传统 RAGLLM Wiki运行逻辑提问临时分片检索提前编译结构化知识Token 消耗每次提问重复消耗成本高一次编译、无限复用节省 95% Token知识形态碎片化、无关联、无沉淀结构化、双向链接、知识复利运维成本需向量库、嵌入模型、分片调优纯文件夹Markdown零运维推理能力弱依赖片段拼接强全局知识关联推理二、通用前置准备两套方案通用2.1 固定目录结构必须严格一致新建空文件夹命名 llm-wiki内部创建固定结构llm-wiki/ ├── raw/ # 原始素材目录只读、不修改 ├── wiki/ # AI 自动维护的知识库目录 └── CLAUDE.md # 全局规则文件通用适配所有模型2.2 通用完整版 CLAUDE.md 规则直接复制即用该规则同时适配Cursor(GPT)和Claude无模型专属限制# LLM Wiki 全局规范Cursor / Claude 通用 ## 角色定义 你是专业AI知识管理员严格遵循分层权限 1. raw 文件夹仅读取禁止修改、删除、覆盖任何原始文件作为唯一溯源依据 2. wiki 文件夹全权负责新建、修改、删除、规整、更新所有知识页面 3. 所有操作必须可溯源禁止编造无依据内容 ## Wiki 页面标准格式 每一个 wiki 页面必须包含完整结构 1. 标题精准概括核心主题 2. 摘要100字以内核心总结 3. 溯源标注对应 raw 原始文件路径 4. 正文结构化分层梳理逻辑清晰 5. 双向内链关联所有相关 Wiki 页面 [[页面名]] 6. 标签分类领域标签 ## 三大核心工作流程规范 ### 1. Ingest 知识入库 - 读取 raw 所有新增素材拆分、提炼核心知识 - 合并重复主题标注内容冲突点 - 生成标准化 Wiki 页面添加双向内链 - 自动更新 wiki/index.md 全局总目录 ### 2. Query 问答与知识沉淀 - 优先读取完整 wiki 知识库全局关联作答 - 回答精准、严谨基于已有结构化知识 - 高价值通用问答自动新建 Wiki 页面沉淀 - 同步更新目录与内链体系 ### 3. Lint 全局巡检规整 - 遍历全部 Wiki 页面修复失效内链 - 合并高度重复页面删除冗余内容 - 统一全文格式、标签、排版规范 - 刷新全局索引目录保证知识库整洁可用 ## 硬性约束 1. 所有知识必须溯源 raw 原始素材无来源不生成结论 2. 禁止随意新建页面优先更新已有相关页面 3. 保持知识库极简、精准、无废话 4. 所有文件命名简洁规范适配中文场景三、方案一Cursor 完整部署教程GPT-4o / 本地模型首选适用人群日常使用 Cursor、无 Claude 账号、偏好 GPT 模型、需要本地私有化部署核心优势Cursor 原生支持多文件读写、全局文件夹上下文、Composer 批量操作完美适配 LLM Wiki 自动化流程3.1 两种规则适配方式任选其一推荐方式二方式一极简兼容新手即用直接将上面的 CLAUDE.md 放在项目根目录Cursor 打开项目后对话中引用根目录文件AI 自动读取并遵守所有规则。无需额外配置开箱即用。方式二Cursor 原生永久规则推荐让规则全局自动生效无需每次手动引用1. 项目根目录新建文件夹.cursor/rules/2. 新建文件llm-wiki.mdc3. 粘贴上述通用 CLAUDE.md 全部内容保存此后打开该 Cursor 项目自动加载 LLM Wiki 规范全程自动遵守权限与格式规则。3.2 Cursor 三步核心指令直接复制执行① 知识入库 Ingest首次搭建/新增素材执行请严格遵循项目内 LLM Wiki 规则读取 raw 文件夹下所有原始素材执行完整的 Ingest 编译任务 1. 提炼所有核心知识生成标准化 Wiki 结构化页面 2. 完成页面双向内链关联、分类梳理 3. 自动生成并更新 wiki/index.md 全局总目录 4. 保证所有内容可溯源不篡改 raw 原始文件 执行完成后返回本次新增、修改的页面清单。② 日常问答 Query基于当前 wiki 完整知识库与全局目录严谨回答我的问题{在此输入你的问题} 若本次问答属于高频通用知识点自动沉淀为全新 Wiki 页面更新内链与全局目录。③ 定期巡检 Lint每周维护一次执行 LLM Wiki 全局 Lint 巡检规整任务 1. 修复所有失效双向内链 2. 合并重复、冗余、相似页面 3. 统一所有页面格式与标签规范 4. 清理无效内容更新全局 index 目录 输出本次完整修改报告。四、方案二Claude 原版部署教程Karpathy 原始方案适用人群追求极致原版体验、大批量长文本资料、需要超大上下文编译核心优势超长上下文窗口一次性处理数万字资料编译完整性、连贯性最优贴合 Karpathy 官方设计4.1 部署步骤1. 沿用前文统一的三层目录结构与通用 CLAUDE.md 规则文件2. 打开 Claude 网页端 / Claude Code 客户端3. 上传整个 llm-wiki 项目文件夹让 Claude 读取 CLAUDE.md 规则与 raw 素材4.2 Claude 专属执行指令原版标准① Ingest 编译入库Follow the rules in CLAUDE.md strictly. Read all materials in the raw folder, compile them into a complete structured LLM Wiki, generate standard markdown pages with bidirectional links, update the wiki/index.md global directory, and ensure all content is traceable to the original raw files.② Query 问答Answer the question based entirely on the compiled wiki knowledge base: {你的问题}. Prefer global knowledge reasoning, precipitate high-quality answers into new wiki pages, and update links and directory synchronously.③ Lint 全局规整Perform a full Lint inspection of the entire wiki library according to CLAUDE.md rules, repair invalid links, merge duplicate pages, unify formatting, update the global index, and output the full modification record.五、双方案对比 选型建议使用场景推荐方案日常学习、个人知识库、Cursor 常驻用户Cursor 方案首选大批量论文、长文档、海量资料编译Claude 原版方案本地私有化、无外网密钥依赖Cursor Ollama 本地模型团队协作、标准化知识库维护双方案通用统一规则即可六、核心避坑指南必看1.raw 文件夹绝对禁止修改原始素材只增不改保证知识可溯源所有迭代仅在 wiki 层完成2. 不要混淆规则文件CLAUDE.md 是通用规则不绑定 Claude 模型Cursor/GPT 均可完美适配3. 分批入库避免单次素材量超出模型上下文防止编译截断、知识缺失4. 定期 Lint 巡检每周一次避免知识库内链失效、内容冗余膨胀5. 搭配 Git 同步整个目录每次编译、巡检后提交版本防止知识丢失七、总结LLM Wiki 之所以被称为下一代知识管理范式核心是把 AI 从「临时检索工具」变成「永久知识编译器」。彻底解决了传统 RAG 碎片化、高消耗、无沉淀的痛点。无需纠结模型日常开发学习优先 Cursor 方案大批量长文本处理优先 Claude 原版方案一套架构、两套部署完全适配所有用户场景轻松搭建属于自己的复利式AI知识库。注部分内容可能由 AI 生成