文章目录Claude Code Local把 Claude Code 搬到本地跑零云端依赖三个本地模型可选四种运行模式数据安全安装方式项目定位Claude Code Local把 Claude Code 搬到本地跑零云端依赖Claude Code 是 Anthropic 推出的 AI 编程工具正常用法需要调用云端 API按量付费。这个项目做了一件事让 Claude Code 完全在 MacBook 上本地运行不联网、不付费、数据不出设备。项目叫 Claude Code Local目前在 GitHub 上拿到了 2800 多个 Star。它靠的是 Apple Silicon 芯片自带的 GPU。M 系列芯片的统一内存架构让 MacBook 能跑起几十亿参数的大模型。项目封装了一套 MLX 原生服务器大约一千行 Python 代码负责把本地模型和 Claude Code 串起来。用起来和原版 Claude Code 几乎一样只是背后调用的 API 从云端换成了本地模型。三个本地模型可选项目目前支持三个模型各有侧重Gemma 4 31B是日常编码的主力。4-bit 量化后占用约 18GB 磁盘32GB 内存的 Mac 就能跑。速度大约每秒 15 个 token写代码够用。Qwen 3.5 122B追求吞吐量。它是 MoE 架构122B 参数里每次只激活 10B所以速度能到每秒 65 个 token。代价是需要 96GB 以上内存。DeepSeek V4 Flash是最近加进来的。284B 参数每次激活 37B支持 100 万 token 的上下文窗口。它用的是 AntirezRedis 作者写的 ds4 引擎纯 C 加 Metal 内核。实测在同一个 MacBook 上本地 DeepSeek 跑赢了云端 Claude 的响应时间。这几个模型不是从通用镜像拉的项目团队自己做了 abliterated 版本上传到 HuggingFace。Abliteration 的意思是去掉了模型内置的拒绝方向让它不会拒绝一些合理但敏感的请求。这不是能力升级用的人还是要遵守上游模型的许可协议。四种运行模式项目提供了四种模式每种都有对应的启动器双击就能用。Code 模式是最基本的用本地模型跑 Claude Code不需要 API Key。Browser 模式让本地 AI 通过 Chrome DevTools 协议控制 Brave 浏览器可以自动操作网页。Hands-Free Voice 模式实现了完整的语音闭环。你说话提问AI 用克隆的声音回答全程在设备上完成。Phone 模式通过 iMessage 收发消息支持文字、图片和视频。数据安全这个项目最强调的一点是数据不出设备。代码不会发送到任何服务器没有遥测没有匿名数据采集。整个数据流都在 MacBook 内部闭环用户输入到 Claude Code CLICLI 调用本地 MLX 服务器MLX 服务器加载模型在 Apple Silicon GPU 上推理结果返回给 CLI。对于处理敏感数据的场景比如律师、会计师、医生这类职业本地运行有实际意义。数据不经过第三方服务器合规风险低很多。安装方式安装过程不复杂。先克隆仓库然后用脚本启动 MLX 服务器再配置 Claude Code 指向本地端口。项目仓库里有详细的 Quick Start 文档三行命令就能跑起来。前提是有一台内存足够的 Mac最低 32GB 能跑 Gemma 31B想要更好的体验建议 96GB 以上。如果你不想自己折腾项目还提供了一个 AirGap Box 服务卖预配置好的 Mac mini到手即用一次性付费没有订阅。项目定位Claude Code Local 解决的是一个具体问题想用 Claude Code 这类 AI 编程工具但不想把代码传到云端。它不是要替代云端 Claude云端模型的能力天花板更高。但在某些场景下本地运行是刚需比如处理机密代码、网络受限的环境、或者单纯不想每月掏 API 费用。项目的 MIT 开源协议也让它可以直接用在商业场景里。对于想在本地试试 AI 编程的人来说这是一个可以跑起来的完整方案。项目的 MIT 开源协议也让它可以直接用在商业场景里。对于想在本地试试 AI 编程的人来说这是一个可以跑起来的完整方案。