文章目录LLaMA Factory100大模型统一微调平台LLaMA Factory100大模型统一微调平台LLaMA Factory 是一款开源的大语言模型微调框架GitHub 上收获了 71,836 个 Star。这个项目由 hiyouga 团队开发维护核心理念是让大模型微调这件事变得简单。无论你是想对 LLaMA、Qwen、DeepSeek、Gemma、GLM 还是 Phi 系列模型做微调都可以在一个统一的框架里完成。LLaMA Factory 覆盖的训练场景很全。预训练、监督微调、奖励建模、PPO、DPO、KTO、ORPO 等方法都内置了。资源不够也不用担心除了全参数微调它还支持 LoRA 和 QLoRA量化精度从 2 bit 到 8 bit 都能选配合 AQLM、AWQ、GPTQ 等方案显卡内存再紧张也有办法跑。一些前沿的优化算法也集成进来了。GaLore、BAdam、APOLLO、Adam-mini、Muon、DoRA、LongLoRA、LLaMA Pro 这些名字在 LLaMA Factory 里都可以通过配置参数直接启用。FlashAttention-2、Unsloth、Liger Kernel 这类加速技巧也都安排好了不需要自己手动 patch。多模态是另一个重点。图像理解、视觉定位、视频识别、音频理解这些任务都能在框架里完成。多轮对话和工具调用也支持模型训完之后可以直接部署成 OpenAI 风格的 API或者用 Gradio UI 做交互式演示。实验过程中想监控训练状态LlamaBoard、TensorBoard、Wandb、MLflow、SwanLab 这些工具都能接入。推理阶段可以选择 vLLM 或 SGLang 作为后端速度有明显提升。安装方式比较常规pip 直接装就行Python 版本建议 3.10 以上。也提供了 Docker 镜像不想折腾环境的话拉下来就能用。整体来看LLaMA Factory 做的事情就是把大模型微调的整个流程串起来了。从数据准备、训练、监控到部署一个工具包搞定省了不少来回切换工具的时间。一个工具包搞定省了不少来回切换工具的时间。