Codex 项目协作与能力扩展指南
在使用 Codex 进行日常开发时有两类能力几乎每天都会用到一是Git 操作与项目改动管理用来安全、可控地处理代码变更二是Skills 与插件用来把 Codex 从「只会写代码的助手」扩展成能生成文档、操作浏览器、甚至接管电脑的多面手。本文按这两条线展开帮助你快速建立清晰的使用习惯。一、Git 操作和项目改动管理Codex 可以直接在你的项目仓库里执行 Git 相关操作。在桌面端 App 中项目为 Git 仓库且已配置远程时还可以 Commit、Push、创建 PR在 CLI 或 IDE 扩展里则通常通过终端命令完成同类操作。这意味着你不必在对话和终端之间来回切换——查看改了什么、整理提交、推进版本都可以在同一个协作流程里完成。1.1 可以查看变更在动手改代码之前先看清「当前工作区到底变了什么」是避免误操作的第一步。Codex 可以帮你在审查面板Diff中查看未暂存与已暂存的文件差异列出新增、修改、删除的文件如通过git status对比某个文件在改动前后的具体内容了解当前分支状态、是否与远程同步筛选「仅本轮改动」Last turn changes快速定位 AI 刚刚修改的部分典型场景包括你让 Codex 改了一轮代码想确认它有没有动到不该动的文件或者合并前想看看冲突区域长什么样。把「先看 diff再决定下一步」当成固定动作能显著降低返工成本。实用建议每次较大改动后先让 Codex 展示变更摘要或打开审查面板自行浏览再决定是否继续修改、暂存或提交。1.2 可以提交代码确认变更无误后Codex 可以协助完成从暂存到提交的完整流程将指定文件加入暂存区git add撰写符合项目风格的commit message执行提交git commit在需要时推送到远程仓库git push提交信息不必你逐字撰写。你可以用自然语言描述「这次改了什么、为什么改」Codex 会帮你整理成简洁、可读的 commit message。若项目有约定格式如 Conventional Commits也可以一并说明。注意两点Codex通常不会主动提交除非你明确要求说「帮我 commit」或「确认后再 push」能避免意外写入历史。涉及敏感文件如.env、密钥配置时应明确告知不要纳入提交养成自查习惯比依赖提醒更稳妥。1.3 建议先审查再提交「能提交」不等于「应该立刻提交」。更推荐的工作流是查看变更 → 人工或 AI 审查 → 确认无误 → 提交审查环节可以检查审查项说明改动范围是否只包含本次任务相关文件逻辑正确性核心逻辑是否符合预期副作用是否引入调试代码、临时代码或未使用导入测试与 lint关键路径是否通过基本验证提交粒度一次提交是否聚焦单一目的把审查嵌入流程比事后从混乱的历史记录里找问题要轻松得多。你也可以直接对 Codex 说「先展示 diff我确认后再提交」——这是实践中非常高效的一句话。桌面端还可使用/review进入代码审查模式或在 diff 行上添加行内评论让 Codex 定点修改后再提交。二、Skills 和插件Codex 最常用的能力扩展Codex 的基础能力已经很强但遇到特定场景——生成图片、写 Office 文档、操控浏览器——往往需要Skills和插件来补足。理解二者的区别与用法是进阶使用的关键。2.1 Skills 是什么1Skills 是一套写好的执行步骤Skill 不是抽象概念而是可重复执行的操作规程。当某个任务有固定套路例如按模板创建 PR、按规范写 commit、按步骤配置 MCP就可以封装成 Skill让 Codex 每次按同一套步骤走减少遗漏和风格漂移。你可以把 Skill 理解为把资深同事的工作 checklist 写进系统里。2Skill 本质上是 Markdown 说明书每个 Skill 对应一个文件夹其中必须包含SKILL.md还可附带参考文档、脚本等辅助文件。SKILL.md里写清楚了适用场景description字段也供 Codex 自动匹配时使用前置条件逐步操作说明注意事项与边界Codex 在需要时会读取完整说明并按文档指引执行而不是临场即兴发挥。因此 Skill 的质量直接取决于文档是否清晰、步骤是否完整。3手动调用 Skill 用$在对话输入框中输入$可以唤起 Skill 选择器从中挑选要使用的技能已启用的 Skill 也会出现在/斜杠命令列表中。例如$imagegen— 调用图片生成$skill-creator— 按引导创建新 Skill需要按团队规范创建 PR → 选择对应的 PR Skill除手动调用外Codex 还可能根据任务内容与 Skill 的description自动选用匹配的技能隐式调用。$适合你明确知道要用哪套流程的场景目标清晰直接指定规程即可。2.2 插件是什么1插件 技能 外部应用连接能力如果说 Skill 是「单份操作手册」插件Plugin更像是「可安装的能力包」。官方定义中插件可以打包一个或多个 Skill外部应用连接Apps如 GitHub、Slack、Google DriveMCP 服务器接入更多工具或共享信息插件让 Codex 从「只在编辑器里干活」延伸到「与外部世界交互」。2调用插件用在对话中输入可以引用插件或其内置 Skill。例如Browser指向内置浏览器能力Computer指向桌面操控能力安装 Google Drive 等插件后也可对应插件名让 Codex 从云端文档、表格中读取或写入内容。与$指向固定流程不同更像是指定通过哪条通道干活——启用某类能力后Codex 会在任务进行中调用插件绑定的工具与子技能。你也可以不手动直接用自然语言描述需求如「总结今天未读的 Gmail」Codex 会从已安装的插件中自动选择合适的工具。3插件和 Skill 可以混合使用二者并不互斥。常见组合方式先用启用插件如 Google Drive再用$调用某个 Skill 约束输出格式在插件完成的任务后直接让 Codex 整理并提交产物到 Git混合使用的原则是插件解决「能连什么、能读什么」Skill 解决「怎么做才规范」。2.3 常用插件和技能总结以下能力在日常协作中出现频率较高。注意有些是Skill用$有些是插件用或自然语言还有些是App 内置能力在设置中开启。1Image Gen最常用的图片生成能力类型Skill· 调用方式$imagegen需要配图、图标草图、UI 概念图时Image Gen 可以直接根据文字描述生成图像省去打开设计工具的中间步骤。适合产品原型示意文档配图简单视觉素材生成结果通常作为项目文件保存可纳入后续 Git 管理。2Documents、Spreadsheets、Presentations类型插件能力· 常见来源Google Drive 等办公类插件这一组能力覆盖Word 文档、Excel 表格、PPT 演示文稿的创建与编辑。安装相应插件并完成授权后Codex 可跨 Drive、Docs、Sheets、Slides 读写内容。典型用途输出技术方案、README 以外的正式文档整理数据表格、导出统计结果制作汇报用的演示幻灯片当你希望 Codex 的产出直接是可交付的办公文件而不是纯 Markdown 或代码时这些插件非常实用。3Browser Use操作浏览器类型App 内置能力· 调用方式Browser或在设置 → Browser 中配置Browser Use 让 Codex 能够在App 内置浏览器中执行操作打开页面、点击、填表、抓取信息等也支持 Browser comments页面标注反馈。适用于验证前端页面实际表现如 localhost 预览查阅动态加载的网页内容自动化重复的网页操作限制内置浏览器通常不支持登录态、Cookie 及浏览器扩展涉及账号登录的页面需另作安排。4Computer Use直接接管电脑类型App 内置能力· 调用方式Computer权限在设置 → Computer Use 中管理Computer Use 让 Codex 可以操作桌面应用与系统界面——不限于浏览器还包括其他 GUI 程序。适合高度依赖图形界面、难以用命令行完成的场景。由于权限较高使用时建议明确任务范围避免在含敏感信息的界面无人监督地运行关键步骤前要求 Codex 说明即将执行的操作小结能力类型触发方式核心作用Git 协作自然语言指令 / 审查面板查看变更、审查、提交、推送Skill$或/按规程执行标准化流程插件或自然语言连接外部应用扩展读写边界内置能力Browser、Computer 设置操控浏览器或桌面建议养成的日常习惯改代码先看 diff提交前先审查固定流程用 Skill$跨系统任务用插件Image Gen 走 SkillOffice 文档走插件Browser / Computer Use 按场景开启掌握 Git 协作与 Skills/插件的分工Codex 就能既守得住代码仓库的纪律又够得着编辑器以外的真实工作流。