个人开发者单枪匹马杀进大厂重围,抱抱脸热榜模型下载量超 70 万!
“素人模型”冲上抱抱脸热榜一位个人开发者竟在大厂林立中杀进抱抱脸 Models Trending 榜前排。这一天刷着抱抱脸的 Trending 榜第一是智谱最新开源模型 GLM - 5.2下载量 6 万多第二是百度无限 OCR能解析 40 多页文档下载量 7 万。再往下个人账号“yuxinlu1”占两个位置下载量分别达 20.7 万和 53.6 万。此前一周其模型霸榜力压 GLM - 5.2智谱负责人在 X 上公开推荐。这波 Hugging Face 热榜前排被大厂等占据如智谱 GLM - 5.2、百度 Unlimited - OCR 等还有国产开源大模型和图像生成方向的 Krea 等。其中夹着两个 luyuxin 的 12B GGUF 模型。这两个新模型将 Fable 5 编程推理能力融入 Gemma4 - 12B 小模型4.5GB 显存可本地、离线运行零 API 成本。V1 是 Coder 版训练数据“可验证”教师数据来自 Cursor 的 Composer 2.5 和 Fable 5发布后曾霸榜榜首。V2 是 agentic 版增加多步工具调用能力benchmark 测试得分约为基础性能 3.5 倍但与 frontier 大模型有差距。作者提到 Fable 5 下线用 Claude Opus 4.8(xhigh)补齐数据微调数据约 1 万条强调数据质量重要。模型因可本地运行受关注是 GGUF 量化版用户可用多种工具加载。V1 最小 Q2_K 版本约 4.5GB推荐 Q4_K_M 约 6.87GBQ8_0 约 11.8GBV2 最小可靠版本 Q3_K_M 约 5.7GB推荐 Q4_K_M 约 6.87GB。作者剧透 V3 沿 12B 做 coding agentic 方向还在开发 Qwen3.6 - 27B 版本。一个人40 小时杀进大厂中间这位作者叫逯雨鑫是美国高校 AI 方向在读研究生本科学数据与商业分析学过全栈开发。爆火模型是自费项目做 V1 为自我提升因学校知识更新慢。为做模型他用掉一个 Claude Max 20×套餐V2 花 40 多小时工作基本一人完成。硬件用 RTX 5090显存 32GB VRAM有 96GB 本地 SSD 资源可调动约 128GB。数据处理最耗时采用“滑动窗口”处理方式。V1 和 V2 以 Gemma 4 - 12B 为底座选择它是为挑战自己和 12B 尺寸有吸引力。逯雨鑫认为本地模型价值是“隐私”和“免费”。V1 发布后起初没关注榜单后排名飙升他认真回复评论和 issue。原来还是个爱看网文的…在 HF 上逯雨鑫发布 9 个公开模型。除爆火模型还有“直接蒸 Claude”的模型和网文微调模型。网文微调模型分四个题材基于 Qwen3.6是他做模型的起点因喜欢看小说后因用户需求转向 coding 和 agentic 方向。个人开发者的机会逯雨鑫建议其他个人开发者“真诚和坚持”。真诚是如实说明模型强弱坚持是接受负面声音。他认为开源艰难即便登顶热榜也无直接收入。他患有 ADHD在 AI 领域成优势认为“AI 时代是 ADHD 的天下”。他认为大厂有优势但个人开发者无包袱可专注解决具体痛点这是个人开源作者的机会。如果你想体验这款本地模型链接如下HF 地址https://huggingface.co/yuxinlu1 。目前最适配的平台是 llama.cpp优先推荐使用。