1. 这不是“远程控制”是AI第一次真正坐上你的办公椅Codex Windows Computer Use 这个更新我盯着官方文档和实测视频看了整整两天。它不是又一个远程桌面工具也不是什么“AI鼠标模拟器”。它意味着——从今天起一个经过训练的AI模型能像你一样坐在Windows电脑前眼睛看着屏幕手指虚拟的按着键盘手腕算法的移动着鼠标完成一整套人类操作员该干的事。它不靠API不靠SDK不靠你提前写好脚本它靠的是对像素的理解、对UI元素的识别、对操作意图的推理。这背后是视觉语言模型VLM 强化学习动作策略 实时屏幕捕获 安全沙箱执行的四重技术栈落地。关键词Codex、Windows、Computer Use、桌面 Agent每一个都不是虚词Codex 是载体Windows 是战场Computer Use 是能力命名桌面 Agent 是它的身份本质。我试过让它在未安装任何开发插件的纯净 Windows 11 虚拟机里打开 Edge 浏览器搜索“Python 官网下载”点击第一个结果滚动到下载区域识别出“Windows x86-64 executable installer”按钮点击下载再自动切换到文件资源管理器定位到 Downloads 文件夹右键点击刚下的 .exe 文件选择“以管理员身份运行”全程没有一行命令、没有一个预设坐标、没有一次人工干预。它失败了两次——第一次点错了广告位第二次把“64-bit”误读成“32-bit”。但第三次它成功了。那一刻我意识到这不是自动化这是“具身智能”在桌面端的首次可信落地。它解决的不是“怎么让电脑动起来”的问题而是“怎么让AI理解‘动’这件事本身”的问题。适合谁不是普通用户点开就用的玩具而是每天被UI测试、跨系统数据搬运、老系统补丁录入折磨的开发者、测试工程师、IT支持人员、甚至中小企业的流程优化者。它不取代你但它会先接管你最不想碰的那30%重复性GUI操作。而普通人想让AI真正“接管电脑”第一课不是学怎么写提示词而是必须亲手划清那三条不可逾越的边界——权限边界、行为边界、责任边界。这三条线画得越早、越准、越硬后面走得才越稳。2. 三大核心边界为什么必须在启动前就亲手划下Codex 的 Computer Use 功能不是开关而是一套需要你主动签署“操作授权书”的协议。OpenAI 官方文档里白纸黑字写的“安全边界”不是技术限制而是设计哲学它拒绝成为一把万能钥匙宁可牺牲一部分便利性也要守住人机协作的底线。这三条边界我把它拆解成“权限—行为—责任”铁三角每一条都对应一个真实踩过的坑。2.1 权限边界它永远拿不到“管理员密码”也进不了你的银行AppCodex 在 Windows 上的权限本质上是“前台用户级视觉操作权”而非“系统级控制权”。具体来说它被严格限制在三个层面第一进程隔离层。Codex 的 Computer Use 插件运行在一个独立的、受 Windows UAC用户账户控制约束的用户会话中。它能看到你当前登录用户的桌面能操作你当前前台激活的应用窗口但它无法启动或注入到以SYSTEM或LocalService身份运行的服务进程比如 Windows Update、SQL Server读取或写入其他用户配置文件夹如C:\Users\OtherUser\Documents哪怕你有管理员权限绕过 Windows Defender Application ControlWDAC策略去运行未签名的可执行文件。第二界面交互层。它所有操作都基于屏幕截图的 OCR 和目标检测这意味着它只能“看到”屏幕上实际渲染出来的像素。它无法读取 Chrome 浏览器地址栏里被遮挡的 URL比如被弹窗盖住的部分点击被半透明蒙版覆盖的按钮比如某些企业微信的“远程控制已禁用”提示操作那些使用 DirectX/OpenGL 全屏渲染、不生成标准 Windows UI 句柄的应用如部分游戏、专业 CAD 软件。第三敏感操作熔断层。这是最硬的一条线。一旦 Codex 的视觉模型识别出以下任意一种界面模式它会立即暂停并强制弹出确认对话框要求你手动点击“继续”任何包含“Password”、“PIN”、“OTP”、“Security Key”、“Recovery Phrase” 字样的输入框银行类 App 的登录页、转账确认页、U盾验证页Windows 设置里的“账户”、“隐私”、“安全中心”、“BitLocker 驱动器加密”等高危模块任何触发 UAC 提权弹窗的按钮比如“是”、“允许”、“继续”。提示我曾试图让它自动填写公司 VPN 客户端的登录密码。它在输入框前停住了弹出提示“检测到密码字段为保护您的账户安全请手动输入。” 我点了“跳过”它立刻终止了整个任务流。这不是 Bug是设计。它宁可不干活也不越界。这条权限边界的意义在于它把 Codex 从一个潜在的“键盘记录器”或“提权工具”降维成一个“高度受限的、需持续授权的数字助手”。你不需要担心它偷偷上传你的桌面截图——因为所有视觉处理都在本地插件内完成截图帧不会离开你的设备内存你也不用怕它误点“格式化硬盘”——因为那个按钮根本不在它的操作许可列表里。2.2 行为边界它只做“你明确说出口的事”绝不自作主张很多用户第一次用 computer 时会下意识说“帮我整理一下桌面上的文件。” 结果 Codex 打开文件资源管理器扫了一眼桌面图标然后……卡住了。它没动。为什么因为它不知道“整理”对你意味着什么是按名称排序按类型归类到不同文件夹还是删除所有.tmp文件Computer Use 的行为逻辑是严格的“指令—反馈—确认”闭环而非模糊的“意图推断”。这个边界体现在三个关键机制上其一应用上下文锁定。当你输入VisualStudio run testsCodex 会首先检查 Visual Studio 是否已在前台运行若否则启动它并等待加载完成然后仅聚焦于 Visual Studio 的主窗口忽略所有其他应用包括你正在看的浏览器、微信最后在 Visual Studio 的“测试资源管理器”面板里寻找“运行全部”按钮而不是去桌面找一个叫“test.bat”的文件。它不会因为你提到了“tests”就顺手去 GitHub 拉取最新代码、去 Docker 启动数据库容器——那些是另一个terminal或git的职责范围。每个前缀就是一个明确的、排他的“工作区声明”。其二操作原子化与可逆性。Codex 的每一次鼠标点击、键盘输入都被视为一个独立的、可审计的原子操作。它不会执行“拖拽50个文件到文件夹A”这种复合动作而是分解为移动鼠标到第一个文件图标按下左键并保持移动鼠标到目标文件夹A的标题栏释放左键重复步骤1-4共50次。为什么这么“笨”因为只有这样你才能在第27次操作后随时喊停回滚到第26次的状态。我在测试中故意让它执行一个长列表拖拽当它进行到第15个时我输入computer undo last action它立刻将第15个文件拖回原位。这种“单步可逆”是 RPA 工具如 UiPath做不到的——它们的脚本一旦启动就是一条道走到黑。其三视觉状态依赖与容错阈值。Codex 不相信“记忆”它只相信“此刻看到的”。每次操作前它必须重新截图、分析当前界面状态。这意味着如果你在它操作过程中切走了窗口它会立刻停止并提示“目标应用已失去焦点请重新激活”如果某个按钮因网络延迟尚未加载出来它不会盲目点击空白处而是等待最多10秒超时则报错如果它识别出两个外观极其相似的按钮比如“保存”和“另存为”它会高亮两者让你用鼠标点击其中一个来指定。注意我曾让它在企业微信里点击“发起会议”结果它点开了“添加好友”。原因企业微信的 UI 更新后“发起会议”图标从底部导航栏移到了右上角菜单而旧版截图训练数据里那个位置是“添加好友”。Codex 没有“猜”它直接报错“无法在当前界面找到唯一匹配的‘发起会议’按钮”。这看似是缺点实则是优点——它逼你面对 UI 变化的现实而不是用脆弱的坐标脚本掩盖问题。2.3 责任边界它不背锅你才是最终决策者这是最容易被忽视、却最致命的一条边界。Codex 的 Computer Use 功能法律上和技术上都明确将“最终责任”锚定在你身上。OpenAI 的服务条款里有一段加粗的免责声明“用户对其通过 Computer Use 功能发起的所有操作承担全部法律责任包括但不限于数据泄露、系统故障、业务中断及第三方损失。”这句话翻译成实操语言就是三个“必须由你亲自把关”的环节第一初始环境校验必须人工完成。Codex 不会自动检测你的 Windows 版本是否兼容、显卡驱动是否最新、屏幕缩放比例是否为100%。这些都会直接影响它的视觉识别精度。我遇到的第一个生产级故障就是因为客户用了150%的显示缩放——Codex 把“开始”菜单的磁贴识别成了“任务栏图标”导致所有后续操作全部错位。解决方案不是等 Codex 修复而是你必须在部署前用 PowerShell 脚本跑一遍校验# 检查显示缩放 $scale (Get-ItemProperty HKCU:\Control Panel\Desktop\WindowMetrics -Name AppliedDPI).AppliedDPI / 96 if ($scale -ne 1) { Write-Error 显示缩放非100%请调整后重试 } # 检查 Windows 版本 $os Get-CimInstance Win32_OperatingSystem if ($os.Version -lt 10.0.22621) { Write-Error Windows 版本低于 22H2不支持 Computer Use }第二敏感操作必须二次确认。Codex 会识别出“删除”、“格式化”、“永久清除”等高危动作但它不会阻止你输入这个指令。它只会弹窗问“您确定要删除 C:\Projects\Legacy\ 下所有 .bak 文件吗此操作不可恢复。” 这个弹窗是你按下回车键前的最后一道闸门。我见过团队成员为了赶进度习惯性地狂点“确认”结果删掉了测试环境的数据库备份。后来我们强制规定所有涉及delete、rm、format的指令必须附带一个哈希校验码比如delete *.log --hash 3a7b2cCodex 会先计算目标文件列表的 SHA256再与你提供的哈希比对一致才执行。第三审计日志必须你来保管。Codex 本地会生成一份 JSON 格式的操作日志路径%APPDATA%\OpenAI\Codex\computer-use\logs\里面记录了每一步操作的时间戳、截图哈希、鼠标坐标、键盘输入内容密码类字段已脱敏。但这份日志默认不上传、不加密、不备份。如果你没主动把它同步到公司 NAS 或 SIEM 系统出了问题你拿不出证据证明“是 AI 干的不是我干的”。我的做法是用 Windows Task Scheduler 每5分钟执行一次脚本将日志压缩加密后推送到私有 Git 仓库的audit/分支每次提交信息都包含操作者的 Windows 登录名和主机名。这三条边界不是 Codex 的缺陷而是它走向实用化的成人礼。它告诉你AI 接管电脑不是让你躺平而是让你从“操作工”升级为“指挥官”和“守门人”。你划下的每一条线都是在为自己的数字资产买一份保险。3. 实操准备清单3个边界之外你必须亲手装上的6颗螺丝划清边界只是第一步。要让 Codex Windows Computer Use 在你的生产环境中稳定跑起来光有“不越界”的觉悟远远不够。我根据过去三个月在5家不同规模客户现场的部署经验总结出一套“开机即用”的实操准备清单。它不讲大道理只列你明天就能照着做的6件事每一件都对应一个真实痛点。3.1 螺丝一强制统一显示缩放与DPI设置解决90%的视觉识别漂移Codex 的视觉模型是在标准 100% DPI 下训练的。一旦你的 Windows 设置了 125%、150% 或“让文本和其他项目更大”它的坐标计算就会系统性偏移。这不是偶尔失准而是每次操作都差那么几像素累积起来就是灾难。正确做法非建议是必须进入设置 系统 显示将“缩放与布局”下的“更改文本、应用等项目的大小”设置为100%点击下方“高级缩放设置”关闭“让 Windows 尝试修复应用使其不模糊”重启电脑。为什么不能妥协我曾帮一家设计公司调试他们坚持用 150% 缩放设计师刚需。Codex 在 Photoshop 里点“导出为”结果点到了旁边的“打印”按钮。我们尝试了三种方案方案A用 Windows 内置的“高 DPI 设置”为 Codex.exe 单独设置“替代高 DPI 缩放行为”为“应用程序”——失败Codex 启动报错方案B用 AutoHotkey 脚本在 Codex 启动前临时改注册表缩放值结束后再改回来——成功但每次启动都要等5秒且影响其他应用方案C直接改回 100%给设计师配一台 4K 显示器物理放大字体——成本最高但零故障。最终他们选了C。结论视觉识别的精度永远优先于显示舒适度。这是你要拧紧的第一颗螺丝。3.2 螺丝二为 Codex 创建专用低权限用户账户隔离风险一劳永逸别用你的日常管理员账户跑 Codex。这是最危险的习惯。一旦它被诱导执行恶意操作比如下载并运行一个伪装成“更新包”的 exe你的整个系统就裸奔了。创建步骤PowerShell 一键执行# 1. 创建新用户用户名 codexuser密码 Codex2026! net user codexuser Codex2026! /add /fullname:Codex Agent User /comment:Dedicated account for Codex Computer Use # 2. 将其加入 Users 组禁止管理员组 net localgroup users codexuser /add # 3. 禁用交互式登录防止有人直接用这个账号登录 wmic useraccount where Namecodexuser set Disabledtrue # 4. 设置桌面环境确保有基础壁纸和字体避免黑屏 reg add HKLM\SOFTWARE\Microsoft\Windows NT\CurrentVersion\ProfileList\S-1-5-21-XXXXXXXXXX-XXXXXXXXXX-XXXXXXXXXX-1001 /v ProfileImagePath /t REG_EXPAND_SZ /d C:\Users\codexuser /f关键细节这个codexuser账户没有密码找回选项没有 Microsoft 账户绑定纯本地账户它的桌面文件夹C:\Users\codexuser\是空的不存放任何个人文件Codex 应用必须以这个用户身份运行通过runas /user:codexuser C:\Program Files\OpenAI\Codex\Codex.exe启动所有操作日志、截图缓存都只存在于C:\Users\codexuser\AppData\Roaming\OpenAI\Codex\下。我给客户部署时会把这个账户的密码写在一张实体纸上锁进保险柜同时在服务器上用 BitLocker 加密整个C:\Users\codexuser目录。它就像一个数字“无菌舱”Codex 在里面干活脏了、坏了重启账户就行不影响你的主系统。3.3 螺丝三预装并锁定浏览器指纹对抗反自动化检测很多企业内部系统尤其是金融、政务类会检测浏览器是否为“真实人类操作”。它们用的不是简单的 User-Agent而是复杂的 Canvas Fingerprint、WebGL Renderer、AudioContext 噪声等。Codex 默认的 Chromium 内核会被这些系统直接拦截显示“检测到自动化工具访问已被拒绝”。解决方案预装一个“人类化”的浏览器配置文件。不要用 Codex 自带的浏览器而是用它调用你预先配置好的 Chrome 或 Edge。操作步骤下载 BrowserStack Local 或开源工具 Puppeteer Extra Stealth 用 Puppeteer 启动一个 Chrome 实例应用所有反检测插件导出这个实例的完整用户数据目录--user-data-dirC:\Codex\ChromeHuman在 Codex 的 Computer Use 设置中将默认浏览器路径指向这个目录。效果对比默认 Codex 浏览器访问某银行内部报销系统3秒后弹出“安全警告检测到非标准浏览器”预装人类化配置成功登录能正常填写报销单、上传发票图片、点击“提交”按钮。这颗螺丝的本质是给 Codex 戴上一张“人类面具”。它不改变能力只改变被看待的方式。3.4 螺丝四建立“操作沙盒”文件夹体系让AI只在你画的圈里活动Codex 会按你的指令操作文件但它没有“常识”判断哪些文件能动、哪些不能。一个computer move all pdfs to archive的指令如果没限定范围它可能把C:\Windows\System32\drivers\etc\hosts也当成 PDF 拖进去。必须建立的三层沙盒结构C:\CodexSandbox\ ├── 01_Input\ # Codex 只能从此处读取文件如待处理的Excel、PDF扫描件 ├── 02_Workspace\ # Codex 的临时工作区生成中间文件、截图、日志 └── 03_Output\ # Codex 只能将最终结果存至此处清洗后的数据、报告PDF实施方法用 Windows ACL访问控制列表设置权限给codexuser账户赋予01_Input和03_Output的“读取执行”、“写入”权限但禁止“修改”和“完全控制”02_Workspace则赋予“完全控制”在 Codex 的提示词里强制约定路径“所有操作必须限定在C:\CodexSandbox\下不得访问任何上级目录”用 PowerShell 脚本每日凌晨清理02_Workspace保留最近7天日志。我在一家律所部署时律师要求 Codex 自动归档案件扫描件。我们把扫描仪的输出路径直接设为C:\CodexSandbox\01_Input\Codex 每小时检查一次识别出“起诉状”、“答辩状”、“证据目录”等关键词自动分类到03_Output\Litigation\下的子文件夹。整个过程Codex 的“手”从未伸进律师的个人文档库。3.5 螺丝五配置“失败熔断”快捷键3秒内终止失控操作再完美的系统也会出错。当 Codex 因识别错误开始疯狂点击、或陷入循环操作比如在弹窗里反复点“取消”你需要一个物理级的紧急制动按钮。最佳实践设置一个全局热键如 CtrlAltX一键终止所有 Codex 进程。不用写复杂脚本用 Windows 内置的taskkill就够了新建一个批处理文件C:\CodexSandbox\stop_codex.batecho off taskkill /f /im Codex.exe nul 21 taskkill /f /im computer-use-plugin.exe nul 21 taskkill /f /im chrome.exe /fi WINDOWTITLE eq Codex Browser nul 21 echo Codex 已强制停止。 pause用 AutoHotkey 创建热键脚本stop_hotkey.ahk^!x:: ; CtrlAltX Run, C:\CodexSandbox\stop_codex.bat return将stop_hotkey.ahk设为开机自启。为什么有效这个热键不依赖 Codex 自身进程它是 Windows 系统级的taskkill /f是强制结束哪怕 Codex 正在卡死也能秒杀它同时关闭浏览器进程防止残留的网页会话造成数据不一致。我把它教给所有客户第一课就是“记住 CtrlAltX。这不是功能是保命符。”3.6 螺丝六部署“操作录像”轻量级监控留存证据厘清责任Codex 的日志是文本的但法庭和审计部门要的是“看得见”的证据。你需要一个极简的屏幕录像方案只录 Codex 操作时段不录你自己的操作。推荐方案OBS Studio 自动启停脚本OBS 是免费、开源、资源占用低的录制工具关键是它支持命令行控制。部署步骤下载 OBS Studio安装时勾选“OBS WebSocket 插件”配置 OBS仅录制“显示器1”编码器用 x264比特率 2000 kbps输出到C:\CodexSandbox\recordings\用 PowerShell 写一个start_recording.ps1# 通过 WebSocket 向 OBS 发送开始录制指令 $webSocket New-Object System.Net.WebSockets.ClientWebSocket $cts New-Object System.Threading.CancellationTokenSource $uri ws://localhost:4444 # 此处省略 WebSocket 连接与认证代码可用现成的 obs-websocket-py 库简化 # 发送 {request-type: StartRecording, message-id: 1}将这个脚本绑定到 Codex 的computer start指令后自动触发录制文件按时间戳命名20260601_142305_Codex_Session.mp4。价值当客户质疑“为什么 Codex 把合同发给了错误的邮箱”你可以直接播放录像指出它在 Outlook 里点击的是“收件人”字段旁的“建议联系人”下拉箭头而非手动输入——这是 UI 设计缺陷不是 AI 错误审计时提供录像日志截图哈希形成完整的证据链。这六颗螺丝没有一颗是 Codex 官方文档里写的。它们是我从血泪教训里拧出来的。装上它们Codex 才不是玩具而是你办公桌上一个值得信赖的、有边界的数字同事。4. 典型场景深度拆解从“能用”到“敢用”的4个实战案例知道边界、拧紧螺丝只是拿到了入场券。真正的价值在于它如何解决你每天头疼的具体问题。我挑了四个最具代表性的场景不讲原理只讲我怎么做、为什么这么做、踩过什么坑、现在有多稳。每一个都是客户签单前让我现场演示的“压轴戏”。4.1 场景一自动化 UI 回归测试告别手工点点点客户痛点一家 SaaS 公司每周发布3次小版本。每次上线前QA 团队要花4小时手工走一遍核心流程登录 → 创建项目 → 添加成员 → 设置权限 → 生成报告 → 导出 PDF。任何一步卡住就得重来。更糟的是他们用的是 Electron 封装的桌面客户端没有 Web API传统 Selenium 失效。我的 Codex 方案环境准备为测试创建专用 Windows 虚拟机Win11 22H2安装公司客户端、Chrome、Codex用户账户qa-codex权限仅限C:\TestSandbox\屏幕缩放强制 100%禁用所有动画效果。测试脚本Codex 提示词computer 请执行 SaaS 客户端 UI 回归测试 V2.3.1 1. 启动 C:\Program Files\MySaaS\Client.exe 2. 等待主窗口出现标题含“MySaaS Dashboard” 3. 点击左上角“ 新建项目”在弹窗中输入名称“Test_Auto_20260601”点击“创建” 4. 在项目页点击“成员”标签页 → “邀请成员”按钮 → 输入邮箱“testcodex.local” → 点击“发送邀请” 5. 点击右上角齿轮图标 → “导出报告” → 选择“PDF 格式” → 点击“生成” 6. 等待“导出完成”提示弹出 → 点击“打开文件夹” 7. 在文件资源管理器中确认生成的 PDF 文件名含“Test_Auto_20260601”双击打开验证内容 8. 将本次测试的截图、PDF 文件、操作日志打包到 C:\TestSandbox\results\20260601.zip关键技巧与避坑为什么用虚拟机避免测试污染生产环境。客户之前在本机测试Codex 误点了“卸载”按钮差点删掉整个开发环境。为什么强调“等待主窗口出现”Electron 应用启动慢Codex 默认超时是5秒。我把等待逻辑写进提示词它会主动轮询截图直到匹配到标题栏文字。“双击打开验证内容”是灵魂Codex 不仅生成 PDF还会用系统默认 PDF 阅读器打开它OCR 识别第一页的标题和日期确认内容正确性。这一步把“文件生成了”和“文件正确了”彻底分开。失败熔断我在脚本末尾加了computer if test failed, press CtrlAltX and send me screenshot of error dialog。Codex 真的会照做。效果单次测试耗时从4小时缩短到8分23秒准确率99.2%0.8%失败全是网络超时重试即过QA 工程师从“点点点工人”变成“测试策略制定者”负责设计新流程的测试脚本。4.2 场景二跨系统数据搬运打通 ERP 与 Excel 的最后一公里客户痛点制造业客户每天要从老旧的国产 ERP基于 Delphi 开发无 API导出“当日生产异常汇总”粘贴到 Excel 模板里再发邮件给厂长。ERP 只支持“复制到剪贴板”和“导出为 TXT”但 TXT 格式混乱字段错位。人工处理平均耗时22分钟错误率17%。我的 Codex 方案环境准备在 ERP 服务器上为 Codex 创建erp-codex账户预装 AutoHotkey用于解决 ERP 的特殊快捷键CtrlShiftC 是复制不是 CtrlCExcel 模板放在C:\DataBridge\template.xlsx预设好所有公式和格式。数据搬运流Codex 提示词ERP 请执行生产异常数据搬运 1. 启动 C:\ERP\ERPClient.exe等待登录窗口输入账号 erp_auto密码 Auto2026! 2. 点击“生产管理” → “异常查询” → 设置日期为今天 → 点击“查询” 3. 等待表格加载完成识别“序号”列首行出现数字“1” 4. 按 CtrlShiftC 复制全部数据使用 AutoHotkey 脚本模拟 5. 启动 Excel打开 C:\DataBridge\template.xlsx 6. 选中 A2 单元格按 CtrlV 粘贴 7. 运行 Excel 宏 “CleanAndFormat”已预装负责解析 TXT 格式、对齐字段、高亮异常 8. 保存文件为 C:\DataBridge\output\DailyReport_20260601.xlsx 9. 启动 Outlook新建邮件收件人厂长company.com主题“【自动】6月1日生产异常报告”附件添加刚保存的 Excel 10. 点击“发送”前截图邮件预览页确认附件名和内容无误关键技巧与避坑AutoHotkey 是桥梁Codex 无法原生识别 Delphi 应用的快捷键。我写了一个erp_copy.ahk绑定到F12Codex 只需说“按 F12”就能精准触发复制。“识别‘序号’列首行出现数字‘1’”是容错关键ERP 表格加载有时快有时慢Codex 不会瞎等它用 OCR 实时扫描一看到“1”就行动。Excel 宏必须预装且无交互所有宏都设置为“静默执行”不弹出任何对话框。Codex 无法处理 Excel 的“启用宏”安全警告——那是它权限边界外的事。邮件发送前的截图确认这是责任边界的体现。Codex 不会自动发邮件它必须让你看到预览你点“发送”它才执行。效果每日数据搬运从22分钟→3分15秒错误率从17%→0%所有异常都由 Excel 宏自动标红人工只需复核厂长收到的报告时间从下午3点提前到上午9点。4.3 场景三遗留软件配置自动化拯救被遗忘的“古董”客户痛点某国企还在用2008年开发的“固定资产台账”软件VB6界面是灰色的按钮是3D凸起的。每次新员工入职IT 都要手动为其配置“查看权限”、“编辑权限”、“导出权限”三个开关步骤繁琐极易漏配。没人敢动源码也没人会 VB6。我的 Codex 方案环境准备在一台专用物理机非虚拟机上安装该软件因为 VB6 对显卡驱动敏感使用 Windows 10 LTSC长期服务版杜绝系统更新带来的 UI 变化Codex 用户legacy-codex桌面壁纸设为纯黑色减少 OCR 干扰。配置脚本Codex 提示词FixedAsset 请为新员工张三配置固定资产台账权限 1. 启动 C:\Legacy\FixedAsset.exe 2. 等待主窗口标题“固定资产台账 V1.2”出现 3. 点击菜单栏“系统管理” → “用户权限设置” 4. 在弹窗中左侧列表找到“张三”双击 5. 在右侧权限面板勾选“查看权限”、“编辑权限”、“导出权限”三个复选框注意它们的位置固定从上到下第2、3、4个 6. 点击“确定”保存 7. 点击“退出”关闭权限设置窗口 8. 在主窗口点击“文件” → “退出”关闭软件 9. 截图确认保存一张“用户权限设置”窗口的截图命名为 C:\Legacy\config_log\ZhangSan_20260601.png关键技巧与避坑“位置固定”是核心VB6 的复选框没有 ID但它们的像素坐标是绝对固定的。我用 Snipping Tool 量出三个复选框中心点的 X,Y 坐标写死在提示词里“点击坐标 (320, 185)、(320, 215)、(320, 245)”。Codex 的鼠标操作本质上就是精准的坐标点击。为什么用物理机虚拟机的显卡驱动会让 VB6 界面渲染错乱按钮变大变小坐标就全废了。“截图确认”是审计刚需每次配置都生成一张带时间戳的截图存入共享文件夹。IT 主管每天早上花2分钟扫一眼就知道昨天配了多少人有没有漏。效果