OpenAI Codex — AI 编程 Agent 详细介绍一、产品概述OpenAI Codex 是 OpenAI 官方推出的终端优先Terminal-First的开源 AI 编程 Agent于 2025 年 4 月首次发布 Codex CLI采用Apache 2.0 开源协议。官方将其定位为自主软件工程工具——能写代码、修 Bug、重构、跑测试、管理多文件变更全部在终端中完成。到 2026 年中Codex 已从单一 CLI 演进为统一 Agent 平台覆盖 CLI、桌面应用macOS/Windows、Web、IDE 扩展VS Code、JetBrains、Xcode和 GitHub 集成。截至 2026 年 6 月Codex 周活跃用户突破 500 万与 Anthropic 的 Claude Code 形成直接竞争。产品形态速览维度说明产品形态终端 CLI 桌面应用 Web IDE 扩展的统一 Agent 平台所属层级模型与编码执行层工具链第 0 层核心角色终端优先的自主编码 Agent是否可独立运行是开箱即用开源协议Apache 2.0代码仓库github.com/openai/codex官方文档developers.openai.com/codex通俗类比Claude Code 的对标竞品——OpenAI 版的终端结对程序员二、发展历程时间里程碑2025 年 4 月Codex CLI 首次发布开源Apache 2.02025 年 5 月Codex Cloud 研究预览发布由codex-1基于 o3驱动2025 年 6 月向 ChatGPT Plus 用户推出2026 年 2 月macOS 桌面应用 GPT-5.3-Codex模型发布超级碗广告投放2026 年 2 月GPT-5.3-Codex-Spark 发布低延迟版Cerebras 硬件快约 15 倍2026 年 3 月GPT-5.4 for CodexWindows 桌面应用Codex Security Agent 发布宣布收购 Astral2026 年 3 月200 万 周活用户宣布合并 ChatGPT Codex Atlas 为一个超级应用2026 年 6 月500 万 周活用户5 个月增长约 730%Record Replay 功能发布三、安装与环境配置3.1 系统要求运行时Node.js 22操作系统macOS、Linux、Windows通过 WSL22026 年 3 月发布原生 Windows 应用认证方式ChatGPT 订阅计划 或 OpenAI API Key3.2 安装步骤# 第一步通过 npm 全局安装npminstall-gopenai/codex# 第二步启动 Codexcodex# 首次运行会引导完成认证ChatGPT 账号或 API Key3.3 认证配置# 方式一使用 OpenAI API KeyexportOPENAI_API_KEYsk-xxx# 方式二通过 ChatGPT 订阅认证OAuth 流程codex login四、核心架构4.1 Agent Loop智能体循环Codex CLI 运行一个核心 Agent Loop用户输入 → 模型推理通过 Responses API→ 工具调用Shell 命令、文件读写、测试、Lint → 结果返回给用户 → 继续下一轮循环关键架构特点特性说明沙箱执行文件操作限定在工作目录网络访问默认关闭统一 App Server一个后端同时驱动 CLI、桌面应用、Web、IDE 扩展——共享配置、历史、技能、线程Prompt Caching重复请求自动复用缓存前缀提升性能Auto-Compaction接近 Token 上限时自动压缩对话上下文开源github.com/openai/codex4.2 三种运行模式模式行为适用场景Suggest默认每次文件编辑和命令都需要人工审批日常开发保持人工控制Auto-edit文件修改自动执行Shell 命令仍需审批信任代码修改但命令需把关Full-auto最大自主权——编辑和命令都自动执行网络仍沙箱高度信任的重复性任务五、核心功能详解5.1 多文件编辑与统一 Diff支持跨多个文件的编辑输出统一的 Diff 供审查一次需求可能涉及多个文件的协调修改。5.2 AGENTS.md / codex.md 项目指令文件项目级指令文件层级化定义项目约定# codex.md项目根目录 目录结构说明src/ 源码tests/ 测试 测试命令npm test 代码风格ESLint Prettier2 空格缩进 禁止模式不使用 any 类型、禁止 console.log支持从根目录到工作目录的层级发现——子目录可以覆盖或扩展上层约定。5.3 斜杠命令Slash Commands/model 切换模型 /permissions 调整权限模式 /review 代码审查 /plugins 管理插件 /skills 管理技能 /compact 压缩上下文 /status 查看当前状态5.4 MCP 插件系统通过 Model Context Protocol 支持第三方集成Figma、Jira、CircleCI、GitHub、Linear 等。5.5 并行多 Agent 编排可同时调度多个 Agent 在隔离的 Git worktree 上并行工作互不干扰。5.6 语音输入终端内按住空格键即可语音输入需求。5.7 CI/CD 集成支持通过管道输入piped input集成到 CI/CD 流水线。5.8 Codex Security Agent2026 年 3 月发布漏洞扫描专用 Agent——在 120 万个 Commit 上测试在 Chromium、OpenSSL、PHP 等项目中发现了约 800 个严重漏洞和 10,000 多个高危漏洞。六、模型体系Codex 由多款模型驱动按任务复杂度分级模型适用场景GPT-5.3-Codex-Spark实时交互编码极低延迟Cerebras 硬件加速GPT-5-Codex-Mini轻量级、快速任务GPT-5.2-Codex标准编码任务GPT-5.3-Codex复杂工程、代码审查GPT-5.4深度推理 100 万 Token 上下文 Computer UseGPT-5.5改进 Token 效率长任务持久化七、实操 Demo场景给项目添加新功能并自测验证# 进入项目目录cd./my-project# 启动 Codexcodex# 在 Codex 交互终端中下发任务分析当前项目结构在 src/api/user.ts 中新增 GET /api/users 分页查询接口 包含参数校验、数据库查询、异常处理写完自动运行npmtest验证# Codex 执行过程# 1. 自动扫描项目结构和依赖# 2. 读取现有代码风格和规范# 3. 编写接口代码# 4. 自动运行测试# 5. 报错自动修复# 6. 输出统一 Diff 供审查八、适用场景✅ 最适合的场景场景原因日常编码任务终端原生体验写代码/修 Bug/重构一站式快速原型开发多种运行模式从保守到全自动灵活切换代码审查与安全扫描内置 Review 和 Security AgentCI/CD 集成支持管道输入自动化的代码生成/修复OpenAI 生态用户与 ChatGPT 账号打通统一认证⚠️ 需注意的场景场景注意事项Windows 用户原生应用 2026 年 3 月才发布之前需 WSL2多模型需求只支持 OpenAI 模型不支持 Anthropic/Gemini 等第三方模型Full-auto 模式Token 成本较难预测建议设置预算上限企业治理成熟度不及 Anthropic Claude Cowork仍在迭代中九、与 Claude Code 的对比维度Claude CodeOpenAI Codex开发商AnthropicOpenAI开源专有开源Apache 2.0模型仅 Claude 系列仅 GPT 系列平台覆盖CLICLI 桌面 Web IDE多 Agent 编排有限并行 Agent 隔离 Worktree安全沙箱基础文件操作沙箱 网络默认关闭周活用户2026.6~42 万2026 年初500 万安装npm install -g anthropic-ai/claude-codenpm install -g openai/codex十、优势与局限总结优势优势说明开源透明Apache 2.0 协议代码完全开放多端统一CLI/桌面/Web/IDE 共享配置和历史灵活运行模式Suggest → Auto-edit → Full-auto按需选择自主度沙箱安全文件操作限定工作目录网络默认关闭语音输入终端内空格键直接语音Safety Agent内置安全漏洞扫描局限局限说明模型锁定仅支持 OpenAI 模型无法使用 Claude/Gemini 等Token 成本Full-auto 模式下成本较难预测Windows 支持原生支持较晚2026.3初期需 WSL2企业治理相对 Claude Cowork 仍不成熟安全事件2026 年 3 月曾发现通过恶意分支名窃取 GitHub Token 的漏洞已修复一句话总结Codex 是 OpenAI 对 Claude Code 的直接回应——一个开源的终端优先编码 Agent凭借 GPT 系列模型 多端覆盖 灵活运行模式在 2026 年实现了爆发式增长成为 Claude Code 最强劲的竞争对手。