MacBookPro M5 24G 本地+云端 AI 栈落地实录:Ollama + Qwen + DeepSeek V4 + Cherry Studio + 硅基流动
小白也能看懂从零搭建一套“本地跑14B云端调V4”的AI开发环境附踩坑大全写在前面为什么你需要这套栈如果你跟我一样手里有一台 M5 标准版 24G MacBook Pro想跑 AI 但又不想每个月交几百块的token费那这篇文章就是为你准备的。我的配置MacBook Pro 14寸 M5 标准版2025 年推出24G1T 深空黑我的需求本地跑 14B 模型润色、补全、隐私场景云端调 DeepSeek V4大纲、推理、对白初稿一个统一的对话壳管理所有模型本地联网搜索能力总成本接近 0 元网上教程要么过时要么只讲单点要么踩坑没人说。这篇全实战每一步都是亲手踩过的。 一、环境清单先看清楚再动手 成本账本地 14B 零电费云端 V4-Flash 比 V4-Pro 便宜 30-40%硅基新号有免费额度MVP 阶段基本 0 元。️ 二、操作步骤每一步都可复现2.1 装 HomebrewM5 认准 Arm/bin/bash-c$(curl-fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)echoeval $(/opt/homebrew/bin/brew shellenv) ~/.zprofile source ~/.zprofile按需可切换镜像源git-C $(brew--repo)remoteset-urlorigin https://mirrors.tuna.tsinghua.edu.cn/git/homebrew/brew.git git-C $(brew--repo homebrew/core)remoteset-urlorigin https://mirrors.tuna.tsinghua.edu.cn/git/homebrew/homebrew-core.git2.2 装 Ollama 拉模型核心步骤brew install ollama ollama serve # 后台起ollama pull qwen2.5:14b ollama pull deepseek-r1:14b验证ollama list ollama run qwen2.5:14b你好期望回复 耗时 3sM5 标准版 10 核 GPU 153 GB/s 带宽14B Q4 日常润色够用 Ollama 调优M5 标准版 24G 专属# 上下文拉到 8K教练报告/短剧分镜够用ollama run qwen2.5:14b/setparameter num_ctx 8192/setparameter num_gpu 18# M5 标准版 10 核 GPU14B 约 28 层设 18 留 CPU 兜底/save qwen2.5:14b-m5~/.ollama/config.json里加{keep_alive:-1} -1 模型常驻不卸载跑长 Agent / 连续润色不反复 load。2.3 装 Cherry Studio统一管理所有模型官网 cherry-ai.com下 Mac dmgArm 原生。配置本地 Ollama设置 → 模型服务 → 添加 → 选 OllamaBase URLhttp://localhost:11434点「获取模型列表」应看到 qwen2.5:14b / qwen2.5-coder:14b / deepseek-r1:14b检测 → 成功 ✅配置云端 硅基流动DeepSeek V4硅基流动官网 siliconflow.cn注册 → 控制台 → API 密钥 → 新建 → 复制 sk-xxx. (https://cloud.siliconflow.cn/me/account/ak)Cherry → 设置 → 模型服务 → 添加 → 选 OpenAI 兼容名称SiliconFlow-DeepSeekAPI Key贴 sk-xxxBase URLhttps://api.siliconflow.cn模型列表里勾deepseek-ai/DeepSeek-V4-Pro大纲/推理替 R1deepseek-ai/DeepSeek-V4-Flash对白/轻量替 V3检测 → 成功 ✅ 走到这一步便可以使用正常切换使用模型了2.4 本地联网搜索SearXNG 容器支持本地模型联网搜索安装配置SearXNG# 先装 OrbStack别装 Docker Desktopbrew install--cask orbstack# 起 SearXNGdocker run-d \--name searxng \-p 8888:8080 \-v$(pwd)/searxng:/etc/searxng\ searxng/searxng:latest配置 settings.yml进入容器改docker exec-it searxng/bin/sh vi/etc/searxng/settings.yml国内不魔法的话需要屏蔽国外引擎配置国内引擎避免超时。可拷贝如下配置进行覆盖(此处折腾好久如有问题可通过日志排查---- docker logs searxng -f )use_default_settings: true server: secret_key:7NBjXjDJKPUV057vCkbzMn0xV8yPDlimiter: false image_proxy: true bind_address:0.0.0.0port: 8888 search: formats:-html-json safe_search: 0 autocomplete:baidudefault_lang:zh-CNoutgoing: request_timeout: 10.0 pool_connections: 100 pool_maxsize: 20 engines:# 国内可用引擎 (启用) -name: baidu engine: baidu shortcut: bd disabled: false categories:[general, web]timeout: 10.0-name: 360search engine: 360search shortcut: 360 disabled: false categories:[general, web]timeout: 10.0-name: sogou engine: sogou shortcut: sg disabled: false categories:[general, web]timeout: 10.0-name: bing engine: bing shortcut: b disabled: false categories:[general, web, images]timeout: 15.0# 需禁用的海外引擎 (避免超时) -name: google engine: google disabled: true-name: youtube engine: youtube_noapi disabled: true-name: startpage engine: startpage disabled: true-name: wikidata engine: wikidata disabled: true-name: wikipedia engine: wikipedia disabled: true-name: duckduckgo engine: duckduckgo disabled: true-name: brave engine: brave disabled: true修改之后重启即可docker restart searxng访问测试Cherry 里配搜索类型SearXNG不是 CustomURLhttp://localhost:8888✅ 别带 /searchAuth留空配置完成之后可在cherry对话中启用联网搜索 三、踩坑实录全网最全建议收藏❌ 坑 1Docker Desktop vs OrbStackM 系列别装 Docker Desktop占内存风扇转跟 OrbStack 抢端口。✅ 直接 brew install --cask orbstackCLI 自动注入Ollama 11434 用 host.docker.internal通。❌ 坑 2SearXNG 浏览器能开Cherry 403现象浏览器 http://localhost:8888能搜出结果但 Cherry 里报 403。原因Cherry 调的是 /search?formatjson 端点这端点必须带 secret_key浏览器走的是 HTML 所以没事。修法确保 settings.yml里 secret_key有值且 Cherry 里 URL 不要带 /search。❌ 坑 3cherry对话中开启联网搜索后一直失败现象cherry对话中开启联网搜索后一直失败403或检索结果为0原因setting配置问题secret_key错误或国外站点超时修法参考文中的setting配置修正。 四、总结我的应用场景是短剧制作M5 标准版 24G 这台机器本地 14B 云端 V4 双通道是最优解隐私/高频/润色 → 本地零费大纲/推理/对白初稿 → 云端 V4-Pro/V4-Flash搜索 → SearXNG 本地容器0 费壳 → Cherry Studio 一站管诸君可尝试。如果这篇文章帮到了你点赞 收藏 ⭐ 关注 三连走起有任何问题评论区留言我看到就回。