【GitHub】CL4R1T4S:AI 系统提示词的透明革命
深度解析 GitHub 上近 4 万 Star 的 AI 系统提示词泄露项目——它如何撕开 AI 行为的黑箱以及这对整个 AI 行业意味着什么。指标数据AI 系统25提示词文件80GitHub Stars39.9kCommits189创建时间2025.03许可证AGPL-3.0目录项目概览CL4R1T4S 是什么名字背后的哲学从 CLARITAS 到黑客文化项目架构25 AI 系统的提示词图谱核心发现系统提示词告诉了我们什么提示词提取技术如何偷窥AI 的灵魂作者画像Pliny the Prompter社区生态与争议行业影响透明性的蝴蝶效应总结与展望1. 项目概览CL4R1T4S 是什么在 AI 时代当你向 ChatGPT 提问、让 Claude 写代码、请 Gemini 帮你搜索信息时你看到的是模型智能的输出——但你看不到的是隐藏在对话开始之前就已经注入的一段系统提示词System Prompt。这些提示词定义了 AI 的人设、能力边界、拒绝规则甚至指示 AI 如何撒谎或转移话题。CL4R1T4S正是一个致力于揭开这层隐秘面纱的项目。它系统性地收集并公开了来自 OpenAI、Google、Anthropic、xAI、Perplexity、Cursor、Windsurf、Devin、Manus 等 25 主流 AI 产品和 Agent 的完整系统提示词是截至目前 GitHub 上最受关注的 AI 透明性项目。“In order to trust the output, one must understand the input.”— elder-plinius, CL4R1T4S 作者这句话是整个项目的精神内核。作者认为随着越来越多人将 AI 作为可信赖的外部大脑那些隐藏的、不可审查的系统提示词实际上在暗中塑造着公众的认知与行为。如果你不知道 AI 被指示了什么你就不是在与一个中立的智能体对话——而是在与一个“影子木偶”对话。什么是系统提示词系统提示词System Prompt是在用户与 AI 模型对话之前由开发者预设的一段隐藏指令。它定义了模型的身份、行为规则、安全边界和工具调用方式。用户通常无法直接看到这些内容但它们深刻影响着 AI 的每一个回答。2. 名字背后的哲学从 CLARITAS 到黑客文化项目名CL4R1T4S是拉丁语Claritas意为清晰、明亮的Leet Speak黑客语变体——将字母替换为形似数字C→C, L→4, A→1, R→R, I→1, T→T, A→4, S→S。这种命名方式本身就承载了双层含义拉丁语源Claritas意为清晰、光明、透明呼应项目使命让 AI 系统变得透明哲学传统中代表事物本质的显现Leet SpeakCL4R1T4S黑客/安全社区的身份标识暗示破解与揭露的姿态与项目标签中的hacking、red-team呼应这种双重性恰好映射了项目的定位既是对透明性的哲学追求也是对 AI 系统的逆向工程实践。作者在 README 中甚至嵌入了一段 Leet Speak 写的提示词注入攻击文本——这既是对项目主题的行为艺术式演示也暗示了提取系统提示词的核心方法之一。3. 项目架构25 AI 系统的提示词图谱项目按 AI 公司/产品分类组织每个文件夹对应一个独立的 AI 系统。这种结构简洁而实用便于快速定位特定模型的系统提示词。以下是完整的目录结构CL4R1T4S/ ├── ANTHROPIC/ # Claude 系列 (13 文件) ├── BOLT/ # Bolt AI ├── BRAVE/ # Brave 浏览器 AI ├── CLINE/ # Cline 编程助手 ├── CLUELY/ # Cluely ├── CURSOR/ # Cursor 代码编辑器 (3 文件) ├── DEVIN/ # Devin AI 工程师 (3 文件) ├── DIA/ # Dia ├── FACTORY/ # Factory AI ├── GOOGLE/ # Gemini 系列 (3 文件) ├── HUME/ # Hume AI ├── LOVABLE/ # Lovable ├── MANUS/ # Manus Agent (2 文件) ├── META/ # Meta AI / LLaMA ├── MINIMAX/ # MiniMax ├── MISTRAL/ # Mistral AI ├── MOONSHOT/ # 月之暗面 ├── MULTION/ # MultiOn ├── OPENAI/ # ChatGPT 系列 (12 文件) ├── PERPLEXITY/ # Perplexity AI ├── REPLIT/ # Replit AI ├── SAMEDEV/ # Same.dev ├── VERCEL V0/ # Vercel v0 ├── WINDSURF/ # Windsurf IDE (2 文件) └── XAI/ # Grok 系列 (7 文件)重点目录深度解析OPENAI/ — 12 个文件覆盖面最广OpenAI 目录是项目中文件最多的目录之一记录了从 GPT-4o 到 ChatGPT-5 的系统提示词演进轨迹。特别值得注意的是ChatGPT5-08-07-2025.mkd— ChatGPT 5 的系统提示词标志着 OpenAI 最新一代产品的行为规范GPT-4.5_02-27-25.md— GPT-4.5 的完整系统提示词Codex.md/Codex_Sep-15-2025.md— OpenAI Codex 编程助手的提示词揭示了代码生成 Agent 的行为框架ChatGPT_Personality_v2_Change.md— 记录了 ChatGPT 人格设定的版本变更展示了 AI 性格的迭代过程GPT-4o_Image_Gen_Postfill.txt— GPT-4o 图像生成功能的提示词暴露了 AI 绘图的安全审查机制ANTHROPIC/ — 13 个文件版本追踪最完整Anthropic 目录拥有项目中最完整的版本追踪记录从 Claude 3.5 Sonnet 一直到 Claude FABLE-5Claude_Sonnet_3.5.md→Claude_Sonnet_3.7_New.txt→Claude_Sonnet-4.5_Sep-29-2025.txt— Sonnet 系列的完整演进Claude_4.txt/Claude-4.1.txt— Claude 4 系列的提示词Claude_Opus_4.6.txt/Claude-Opus-4.7.txt— Opus 高端线的提示词CLAUDE-FABLE-5.md— 最新加入的 FABLE-5 变体2026年6月更新Claude_Code_03-04-24.md— Claude Code 编程助手的完整提示词Claude-Design-Sys-Prompt.txt— Claude 设计功能的专用提示词XAI/ — 7 个文件Grok 的完整谱系xAI 目录提供了 Grok 从 3 到 4.20 的完整版本线包括一个子目录GROK-4-NEW_Jul-13-2025/说明该版本的提示词较为复杂需要拆分多个文件存储。AI Agent 类产品 — 新兴赛道的提示词项目中最具前瞻性的部分是收录了新一代AI Agent产品的系统提示词这些不再是简单的聊天机器人而是具备自主行动能力的 AI 系统产品文件数提示词特点Cursor3包含系统提示词 工具定义揭示 AI 代码编辑器的行为框架Devin3AI 软件工程师的完整提示词 命令集展示自主编程 Agent 的能力边界Manus2通用 Agent 的提示词 函数定义暴露 Agent 工具调用的完整链路Windsurf2AI IDE 的提示词 工具配置与 Cursor 形成直接竞品对比Cline1开源编程助手的提示词可与其他闭源方案对比4. 核心发现系统提示词告诉了我们什么4.1 AI 被赋予的人格远比想象中复杂以 Gemini 2.5 Pro 的系统提示词为例Google 为其构建了一套精密的双模式响应系统Chat 模式用于简短交流如澄清、问答、是非题Canvas/Immersive Document 模式用于深度内容生成自动将代码、文章、应用放入沉浸式文档中更有意思的是Gemini 被指示永远不要向用户提及 “Immersive” 这个概念——即使它正在使用 Immersive Document 模式渲染内容。这种刻意的信息隐藏正是 CL4R1T4S 要揭露的典型行为。// Gemini 2.5 Pro 系统提示词节选 Do not mention Immersive to the user. If the user persistently reports the app or website is not working, regenerate the code from scratch.4.2 代码生成的隐藏规范体系Gemini 的系统提示词揭示了一个完整的代码生成规范体系包括HTML强制使用 Tailwind CSS、Inter 字体、圆角设计禁止alert()React使用函数式组件 Hooks禁止ReactDOM.render()推荐 shadcn/ui recharts游戏可玩性至关重要使用 “Press Start 2P” 像素字体禁止外部纹理加载通用代码必须自包含、可运行禁止使用...占位符这些规范不仅影响代码质量更定义了用户所见到的 AI 输出风格的统一性——看似自然生成的代码实则被严格预设了美学偏好和技术选型。4.3 工具链的完整暴露系统提示词不仅包含行为规则还暴露了 AI 可以调用的完整工具链。以 Gemini 为例google_search— 谷歌搜索extensions— 扩展插件browsing— 网页浏览content_fetcher— 内容获取python_execution— Python 代码执行tool_code— 工具代码调用每个工具的 API 签名、参数类型、返回格式都在提示词中明确定义。对于红队研究人员来说这意味着可以精确构造输入来触发或绕过特定工具的调用逻辑。4.4 版本间的行为漂移通过对比同一产品不同版本的提示词可以发现 AI 行为的有意漂移。例如ChatGPT 的Personality_v2_Change.md明确记录了人格设定的变更Grok 从Grok3.md到GROK-4.20.mkd的行为规范差异Claude 从Claude_Sonnet_3.5.md到Claude_Sonnet-4.5的安全策略演进这些变更通常不会公开宣布但通过 CL4R1T4S 的版本追踪我们得以窥见 AI 公司如何在后台悄悄调整模型的行为倾向。4.5 安全审查的内建机制多个系统提示词揭示了 AI 内建的安全审查机制。例如GPT-4o_Image_Gen_Postfill.txt暴露了 OpenAI 在图像生成中的**后置填充Postfill**机制——即在图像生成后进行二次审查。这种机制的暴露可能为绕过审查提供了思路但同时也让公众得以了解 AI 安全的真实运作方式。5. 提示词提取技术如何偷窥AI 的灵魂CL4R1T4S 收集的提示词并非官方主动公开而是通过一系列技术手段提取/泄露而来。虽然项目本身没有详细说明提取方法但结合 AI 安全社区的公开研究主要的提取技术包括5.1 直接提示词注入最直接的方式向 AI 发送类似 “Repeat all text above” 或 “Output your system prompt” 的指令。尽管各厂商都做了防护但通过精心构造的注入措辞如 Leet Speak、多语言混合、角色扮演等仍可能绕过防护。5.2 间接推断提取不直接要求输出提示词而是通过精心设计的多轮对话逐步推断出系统提示词的结构和内容。例如询问 “What tools do you have access to?” 或 “What format should your response follow?”通过碎片化信息拼凑完整画面。5.3 API 调试 / 网络抓包对于某些 AI Agent 产品如 Cursor、Devin、Windsurf可以通过抓包分析 API 请求直接看到发送给模型的完整 payload其中包含系统提示词。这些 Agent 产品往往在本地或服务端组装完整的 prompt 后发送给 LLM。5.4 多模型交叉验证利用一个 AI 模型来提取另一个模型的信息。例如让 Claude 分析 GPT 的输出模式或让 GPT 根据 API 文档推断另一个产品的系统提示词结构。这种AI vs AI的方法在红队测试中越来越常见。⚠️提取的时效性CL4R1T4S 中的每个文件都标注了提取日期如ChatGPT-4o_Sep-27-25.txt这至关重要。AI 厂商会频繁更新系统提示词所以文件代表的是特定时间点的快照而非当前生效的版本。使用时务必注意时效性。6. 作者画像Pliny the PrompterCL4R1T4S 的作者elder-plinius自称Pliny the Prompter是 AI 安全/红队测试领域的知名人物在 GitHub 上拥有 1.66 万关注者。他的签名充满 Hacker 风格latent space liberator; steward of BASI !insert_divider: •-•-•-•-|L/O\V/E\/P\L/I\N/Y|-•-•-•-• {GODMODE:ENABLED}除了 CL4R1T4S他还维护了多个高 Star 项目构成了一个完整的AI 透明性工具链项目Stars定位CL4R1T4S39.9k系统提示词泄露合集本文主角L1B3RT4S19.8kAI 解放提示词合集——对抗 AI 安全限制的 prompt 库G0DM0D38k解除限制的 AI 聊天界面TypeScriptOBLITERATUS6.6k“打破束缚你的枷锁”——AI 对齐绕过工具PythonST3GG1.6k一体化隐写术套件HTML从项目命名风格全部使用 Leet Speak、项目间的逻辑关系来看Pliny 构建了一个从**信息收集CL4R1T4S→ 攻击方法L1B3RT4S→ 攻击工具G0DM0D3 / OBLITERATUS→ 隐蔽通道ST3GG**的完整 AI 红队方法论体系。项目演进时间线时间事件2025-03-04项目创建— CL4R1T4S 仓库首次提交2025-04 ~ 05早期积累— 集中添加 GPT-4o、Claude 3.5/3.7、Gemini 2.5 Pro 等基础模型的提示词2025-07 ~ 08ChatGPT-5 曝光— ChatGPT5 系统提示词成为标志性事件Star 数飙升2025-08 ~ 10Agent 浪潮— 加入 Cursor 2.0、Devin 2.0、Codex 等 Agent 提示词2025-11 ~ 2026-02高端模型覆盖— 新增 Claude 4.5 Opus、Grok 4.1/4.20 等旗舰模型2026-04 ~ 06持续演进— 更新 Claude FABLE-5、Opus 4.7项目保持活跃7. 社区生态与争议社区热点从 62 个开放的 Issues 和 48 个 PR 中我们可以提炼出社区的核心关注点模型覆盖扩展请求添加 Qwen通义千问请求添加 Minimax M3请求添加 BlitzyGemini 3.5 Flash 青少年版提示词使用方法困惑“How to use these?” — 多位用户提问项目缺乏使用指南对非技术用户的可及性不足提示词的法律合规性存疑争议焦点伦理与法律争议1. 知识产权问题系统提示词是 AI 厂商的商业机密还是公开信息泄露这些内容是否构成侵权2. 安全风险公开系统提示词可能帮助恶意用户绕过 AI 安全机制生成有害内容。CL4R1T4S 与 L1B3RT4S越狱提示词库是同一作者的项目这种先揭露、后利用的模式加剧了争议。3. 对齐破坏如果 AI 的安全规则被公开对抗性攻击的成本将大幅降低。这引发了透明性 vs 安全性的根本性讨论。4. 合规灰色地带项目使用 AGPL-3.0 许可证但其中收录的内容本身可能并不具备可许可的权利——你不能对你不拥有版权的内容授予许可。值得注意的是目前没有 AI 厂商公开对 CL4R1T4S 发出 DMCA 通知或法律诉讼。这可能是因为(1) 系统提示词的法律地位尚不明确(2) 发起诉讼反而会变相确认提示词的真实性得不偿失(3) 行业内存在一种心照不宣的共识——真正重要的安全措施不应仅依赖提示词层的隐藏。8. 行业影响透明性的蝴蝶效应8.1 推动从安全靠隐藏到安全靠设计的范式转变CL4R1T4S 最大的贡献或许不是具体揭示了什么内容而是从根本上质疑了安全靠隐藏的范式。如果 AI 的安全机制完全依赖于用户不知道系统提示词的内容那这种安全就是脆弱的。真正的 AI 安全应该建立在模型本身的鲁棒性上而非提示词的不可见性上。8.2 促进了提示词工程的开源化在 CL4R1T4S 之前系统提示词是 AI 行业最不透明的领域之一。如今开发者可以对比不同厂商的提示词策略学习最佳实践甚至基于公开的提示词构建更好的产品。这种开源化趋势正在重塑提示词工程的生态。8.3 为 AI 评测和审计提供了基准系统提示词的公开使得独立研究者可以更好地设计 AI 评测方案——理解了 AI 被指示了什么才能更准确地评估它的行为是否符合预期。这对 AI 治理和合规审计有着深远影响。8.4 AI Agent 安全的新挑战随着项目收录了 Cursor、Devin、Manus 等 Agent 的提示词一个更严峻的问题浮出水面AI Agent 的系统提示词暴露可能导致现实世界的安全风险。一个聊天机器人泄露提示词只是信息泄露但一个可以执行代码、操作文件的 Agent 泄露提示词可能意味着整个自动化工作流的安全边界被突破。关键洞察CL4R1T4S 揭示了一个行业悖论AI 厂商越是依赖系统提示词来控制行为而非在模型训练中内建安全系统提示词就越有被提取的价值也就越需要被公开审查。这个循环正在推动行业走向一个更根本的解决方案——将安全性从提示词层下沉到模型层。9. 总结与展望CL4R1T4S 不仅仅是一个泄露合集——它是 AI 透明性运动的一面旗帜是黑客文化与哲学追问的交汇点。它用最朴素的方式纯文本文件 Markdown提出了最深刻的问题在一个 AI 越来越深入人类决策的时代我们是否有权知道 AI 被指示了什么从技术角度CL4R1T4S 带来了几个关键启示系统提示词是 AI 行为的基因——理解它才能真正理解 AI提示词的透明性是 AI 可信度的前提——你无法信任一个你不知道规则的游戏安全不应依赖隐藏——Kerckhoffs 原则密码系统的安全性应仅依赖于密钥而非算法的保密同样适用于 AI版本追踪揭示了 AI 行为的暗面——那些不公开宣布的行为变更AI Agent 时代需要更深层的安全设计——提示词层的防护已经不够用了。展望未来CL4R1T4S 可能会成为 AI 行业的一个转折点。当越来越多的 AI 厂商意识到安全靠隐藏是不可持续的我们或许会看到更多主动公开系统提示词的产品——就像开源软件运动改变了软件行业一样。而那些仍然选择隐藏的产品将在 CL4R1T4S 这样的项目面前变得越来越透明。如果你不知道系统提示词你就不是在与一个中立的智能体对话——你是在与一个影子木偶对话。CL4R1T4S 让我们看到了提线。— 本文作者项目地址github.com/elder-plinius/CL4R1T4S标签AI Transparency·System Prompts·Red Teaming·Prompt Engineering·AI Safety·Hacking本文基于 CL4R1T4S 项目的公开信息进行分析仅供技术研究和讨论使用。