AI 模型 API 价格一览(实时更新)
本文按模型厂商梳理主流大语言模型 API 的最新定价涵盖 DeepSeek、OpenAI、通义千问、文心一言、豆包、ChatGLM 等帮助开发者和企业快速选型。更新日期2026 年 6 月一、国内模型 API 价格1.1 DeepSeek模型输入价格元/百万 Token输出价格元/百万 Token上下文窗口说明DeepSeek V3.128128K旗舰模型综合能力最强DeepSeek V32864K性价比之选DeepSeek R141664K推理增强数学/编程强1.2 通义千问阿里云 DashScope模型输入价格元/百万 Token输出价格元/百万 Token上下文窗口说明Qwen3-235B416128K旗舰235B 参数Qwen-Turbo26128K性价比型Qwen-Plus0.82128K轻量高效Qwen-Long0.521M超长上下文Qwen-VL-Max3932K视觉理解1.3 文心一言百度智能云模型输入价格元/千 Token输出价格元/千 Token上下文窗口说明ERNIE 4.50.120.24128K旗舰模型ERNIE 4.0 Turbo0.030.06128K高性价比ERNIE Speed免费免费8K轻量免费版ERNIE-Lite免费免费8K极致轻量1.4 豆包字节跳动火山引擎模型输入价格元/百万 Token输出价格元/百万 Token上下文窗口说明Doubao-Pro-32K0.8232K主力模型Doubao-Pro-128K59128K长上下文Doubao-Lite-32K0.30.632K轻量Doubao-Seedance按秒计费--视频生成1.5 ChatGLM智谱 AI模型输入价格元/百万 Token输出价格元/百万 Token上下文窗口说明GLM-4-Plus55128K旗舰模型GLM-4-Air0.50.5128K高性价比GLM-4-Flash免费免费128K免费版1.6 其他国内模型厂商代表模型输入价格元/百万 Token输出价格元/百万 Token说明Moonshot/KimiMoonshot-v1-128K1212长文本专长零一万物Yi-Large1010中英双语MiniMaxabab6.5s55多模态讯飞星火Spark 4.00.1 元/千 Token0.1 元/千 Token语音交互强二、国外模型 API 价格2.1 OpenAI模型输入价格元/百万 Token输出价格元/百万 Token上下文窗口说明GPT-4o17.570128K多模态旗舰GPT-4o-mini1.054.2128K高性价比o3-mini7.730.8200K推理模型GPT-4.114561M超长上下文2.2 Anthropic Claude模型输入价格元/百万 Token输出价格元/百万 Token上下文窗口说明Claude Opus 4.5105350200K最强旗舰Claude Sonnet 4.52170200K均衡之选Claude Haiku 3.55.628200K轻量快速2.3 Google Gemini模型输入价格元/百万 Token输出价格元/百万 Token上下文窗口说明Gemini 2.5 Pro8.7543.751M旗舰Gemini 2.5 Flash1.054.21M速度优先三、性价比速查同价位横向对比以 128K 上下文、100 万 Token 输出为基准价格区间代表模型适合场景免费ChatGLM-Flash、ERNIE Speed、ERNIE-Lite个人测试、轻量对话极低价 2元/百万DeepSeek V3.1(8元)、Qwen-Plus(2元)、Doubao-Pro(2元)、GPT-4o-mini(4.2元)大批量调用、创业项目性价比档2-10元DeepSeek R1(16元)、Qwen3(16元)、Doubao-Pro-128K(9元)生产环境主力高端档 50元GPT-4o(70元)、Claude Opus(350元)复杂推理、专业创作性价比 Top 5综合价格与能力排名模型输出价格推荐理由1DeepSeek V3.18 元/百万 Token能力接近 GPT-4o价格仅 1/92Qwen-Turbo6 元/百万 Token阿里生态中文能力突出3GPT-4o-mini4.2 元/百万 Token小任务首选速度快4Doubao-Pro-32K2 元/百万 Token豆包生态超低价格5GLM-4-Air0.5 元/百万 Token中文友好价格极低四、省钱实战策略4.1 按场景选模型日常对话、客服 → Doubao-Pro / GPT-4o-mini成本极低 代码生成、编程 → DeepSeek V3.1 / Claude Sonnet 中文创作、翻译 → 通义千问 Qwen-Turbo / ChatGLM-4-Air 复杂推理、分析 → DeepSeek R1 / o3-mini 多模态理解 → GPT-4o / Qwen-VL-Max 视频生成 → Doubao-Seedance / 可灵4.2 三个省钱技巧技巧一利用统一 API 网关动态路由不同模型价差可达几十倍。通过 API 网关按请求复杂度自动路由# 简单问题走便宜模型复杂问题走强模型defroute_model(question:str)-str:iflen(question)100and推理notinquestion:returndoubao-pro-32k# 2 元/百万elif代码inquestionor编程inquestion:returndeepseek-chat# 8 元/百万else:returnqwen-turbo# 6 元/百万技巧二缓存常见问题简单重复的查询如 FAQ、产品介绍命中缓存后直接返回完全不走模型调用成本降为零。技巧三选择合适的上下文窗口长上下文价格更贵。大多数对话场景 32K 就够了不需要为 128K 或 1M 窗口付费。评估实际需求再选。4.3 如何用一个 Key 调用以上所有模型看完几十个模型的价格和协议你应该已经发现了——DeepSeek 用 OpenAI 协议但 Key 要去 DeepSeek 官网申请通义千问用 DashScope 自有协议Key 去阿里云申请文心一言又是另一套鉴权方式Key 去百度云申请OpenAI、Claude 还要解决跨境支付……每接入一个新模型就要注册一个新平台、充值一个新账户、对接一套新协议。一种更省事的方式是走统一 API 网关一个 API Key 覆盖上述所有模型按实际用量统一计费不用在各个平台之间来回切。目前国内已有平台在做这件事——比如星枢无极兼容 OpenAI 协议后端对接了 40 国内外模型前端对开发者只暴露一个统一端点。切换模型只需改model参数成本和 Token 消耗在一个后台统一查看。对于需要多模型 A/B 测试、自动降级、成本对比的团队来说这比逐个平台对接高效得多。五、选择困难一张图帮你决策你的需求是什么 ├── 我有预算限制要最便宜的 │ ├── 所有场景通用 → GLM-4-Air0.5 元/百万极低价 │ ├── 要免费试水 → ChatGLM-Flash / 文心 ERNIE Speed │ └── 还是要强一点 → GPT-4o-mini4.2 元/百万性能不差 │ ├── 我要综合最强价格不太敏感 │ ├── 英文场景 → Claude Sonnet 4.521 元/百万 │ ├── 中文场景 → DeepSeek V3.18 元/百万 │ └── 多模态 → GPT-4o70 元/百万 │ ├── 我要中文最懂中国用户的 │ ├── 首选 → 通义千问 Qwen-Turbo / DeepSeek V3.1 │ └── 备选 → ChatGLM-4-Air │ └── 我只关心代码能力 ├── 编程首选 → DeepSeek V3.1 / Claude Sonnet └── 推理最强 → DeepSeek R1 / o3-mini六、注意事项价格波动模型厂商经常调价通常是降价本文每月更新一次建议收藏计费差异部分厂商按输入输出分别计费如 DeepSeek、OpenAI部分输入输出同价如 ChatGLM计算总成本时注意区分免费版限制免费模型通常有 QPS每秒请求数和总调用量限制生产环境谨慎使用汇率换算国外模型以美元定价本文按 1 USD ≈ 7 CNY 换算协议差异各厂商 API 格式不统一用统一网关可以避免对接多套协议的成本本文数据截至 2026 年 6 月。实际价格以各厂商官网为准。如需通过单一端点访问上述全部模型的 API可了解支持 OpenAI 协议兼容的模型中转服务。