caveman 让 AI 用最少的 Token 说最准的话。读完本文你将了解安装体验 | 原理拆解 | 正常 vs 穴居人对比 | Token 经济学 | 谁该用谁不该用 这个项目解决什么问题你给 Claude Code 发了句帮我写个二分查找AI 回你三段话“Great question! Let me think about the best approach for this. First, we need to ensure the array is sorted. Then we can proceed with the implementation…”废话占掉一半 Token有用信息拖到最后。你只想要个函数签名AI 非把你当小学生教。这个问题不是个例。大语言模型被灌了大量详细解释型数据Stack Overflow、教程、博客默认每句话都要展开。教学场景这是好事开发场景是灾难——浪费 Token、拖慢节奏、打乱心流。caveman 的解法简单粗暴让 AI 像穴居人一样说话。项目作者 JuliusBrussee 定义了一套 Claude Code Skill核心约束只有一句话——用最少的词表达最多的信息。去掉 “Let me think”、“In conclusion”、“First of all” 等等一切装饰性语言直接说结论。上线第二天冲上 GitHub Trending 第一24 小时涨星 2863总星数突破 80000。开发者对反啰嗦工具的渴望写在涨星曲线里。 快速上手安装只需一条命令claudeaddskill JuliusBrussee/caveman装完之后试试这些# 写个二分查找claude二分查找实现# 解释一段 TypeScript 代码claude解释这个高阶组件# 调试错误claudeReact: Maximum update depth exceeded预期输出对比正常模式输出约 120 Token I understand youre looking for a binary search implementation. Binary search works on sorted arrays with O(log n) time complexity. Heres how it works... 穴居人模式输出约 40 Token Binary search: sorted array, O(log n). mid(lr)/2. arr[mid]target? return mid. Too low? lmid1. Too high? rmid-1.差距就是这么大——内容没缩水删掉的只是对话礼仪。⚠️ 注意这三点Skill 冲突如果用了其他自定义 Skill比如 code-reviewer、git-helpercaveman 的系统 prompt 可能会被覆盖。建议新建一个独立的 Claude Code 配置文件中文兼容性caveman 的示例全部是英文。启用后在中文对话中AI 有时会混用中英文需要你在 prompt 里加一句全中文回复来修正代码审查场景慎用PR Review 需要详细说明为什么改、怎么改穴居人模式倾向于只说改这里需要人工补上下文⚙️ 技术原理Token 都浪费在哪了先做个实验。一个典型的 Claude Code 回复通常包含这几类废话 Token废话类型例子每次浪费占比开场客套“Great question!” “I’d be happy to help”5-10 Token12%过度解释“Let me break this down step by step”8-15 Token18%缓冲短语“In general, it depends on several factors”6-12 Token14%结论废话“In conclusion, to summarize what we discussed”5-8 Token10%语气填充“Well, actually, to be more precise”4-8 Token8%caveman 做的就是把上表中的每一行从系统 prompt 里删干净。核心机制caveman 的工作原理可以用一句话概括通过系统级 prompt 约束 示例引导改变模型的输出先验分布。具体来说它做了三件事设定行为约束在系统 prompt 中直接指明不要客套、不要过渡、直接给答案给出对比示例10 组正常 vs 穴居人的对比在 few-shot 层面调整输出偏好隐性 Token 预算通过约定输出格式每行不超过 N 个字间接限制总 Token用户输入Claude Code 收到 prompt正常模式caveman 模式系统 prompt礼貌、完整、详尽输出120 Token 含 45 Token 废话系统 prompt仅事实、无修饰、短句输出40 Token 含 3 Token 废话Token 有效率92%为什么不是简单的把话说短了如果只是删单词写个 sed 就能干。深层原因是大模型的注意力分配遵循输出约束规律。当系统 prompt 明确要求用最少词表达最多信息时模型会把注意力从保持对话流畅转移到压缩信息上。这不仅仅是输出变短——输出质量本身会变因为模型被迫在有限的 Token 预算内做优先级排序。结果就是模型主动选择讲关键信息而不是把能讲的都讲一遍。️ 架构分析模块结构caveman 的代码结构极为精简只有 3 个核心文件caveman/ ├── skill.json # Claude Code Skill 元数据声明 ├── prompt.md # 核心系统 prompt灵魂文件 └── examples/ ├── code.md # 代码场景对比示例 ├── debug.md # 调试场景对比示例 └── explain.md # 解释场景对比示例设计亮点极简到极致整个项目代码量不超过 200 行。不是所有好工具都需要复杂架构单点穿透不试图解决AI 输出质量这个大问题只解决AI 太啰嗦这一个具体痛点——这种窄聚焦让它几乎零学习成本零成本试错claude remove skill caveman一键回退没有任何副作用同类项目的对比caveman 设计哲学定位窄聚焦只解决一个痛点不做大而全Token 浪费问题简洁到 3 个文件普通 Claude Code Skill自定义 Prompt 模板Token 压缩工具不够好的地方caveman 的毛病和优点同样明显布尔开关式控制要么全开要么全关缺少灰度。开发者场景要简洁写文档场景要详细——但你没法做这个区分中文适配缺失示例全是英文中文场景下模型会混用中英文而且中文本身 Token 消耗和英文不同65% 的节省比例对中文未必成立团队协作不友好PR Review 中穴居人模式写的评论会让队友困惑——“为什么 AI 突然像在发电报”⚡ 竞品对比方案Token 节省安装复杂度可控性适合场景caveman50-65%一行命令低全开/全关个人开发自定义 Prompt20-40%需手动写高精确控制Token 后处理0%中等中已定稿文本换个模型看模型无低替代方案caveman 在零成本 vs 效果比这个维度上是目前最好的选择。✅ 总结优点安装门槛为零价值立现Token 节省 50-65%对 API 高频用户效果显著去废话后心流更连续适合赶工冲刺缺点中文适配差需要额外调教不适合教学/文档输出场景团队场景容易造成沟通断层谁适合现在就用每天和 Claude Code 打交道的专业开发者追求极致效率的命令行流心疼 API 费用又想保持质量的人谁建议等等需要用 AI 产出一手文档的写作者刚接触 AI 编程的新手需要对外输出专业感的场景caveman 的启发不在技术上——它让我重新想什么是好输出。很多时候瓶颈不在模型不够强而在沟通方式太啰嗦。少说话说准话本身就是生产力。