机器人问题关闭检查表:别把“后面没再出现”当成关闭依据
适用场景机器人联调、跑机测试、现场试用、交付前问题复盘和问题关闭会。典型情况偶发故障后后续测试暂时没有复现修改参数、换线、重启模块或调整逻辑后现象消失现场反馈减少但没有明确回归记录问题关闭会上出现“应该好了”“先关掉再观察”需要判断问题是否真正满足关闭条件。本文不是讲复杂流程而是给一个可直接用于工程评审的问题关闭模板。1. 核心原则问题关闭不是“现象没了”而是“证据收住了”。至少需要确认三件事层级要回答的问题不足的写法现象定义到底发生了什么异常、偶发、不稳定条件覆盖在什么条件下出现后续是否覆盖后面没再出现证据闭环修改为何有效如何验证应该是这个原因、跑了一会儿没问题2. 问题关闭前检查表检查项必须回答建议证据是否通过现象描述是停顿、掉线、误报警、任务失败还是状态不一致问题单、视频、截图、现场记录是 / 否触发条件原问题出现在什么任务步骤、姿态、负载、环境或恢复流程复现记录、测试条件表是 / 否发生时间线哪个模块先异常哪个模块后报警日志、波形、状态字、视频时间戳是 / 否根因判断根因证据是什么排除了哪些可能原因对比测试、链路排查记录是 / 否修改动作改了参数、逻辑、线束、连接器、结构还是流程变更记录、版本号、参数差异是 / 否回归验证是否覆盖原触发条件是否覆盖相关任务回归测试记录是 / 否影响面确认是否影响安全、效率、接口、状态机、其他任务影响分析、回归清单是 / 否关闭责任谁确认关闭谁保留后续观察责任关闭会议纪要、责任人是 / 否3. 五句高风险关闭话术与追问3.1 “后面没再出现”风险没再出现不等于触发条件已覆盖。追问后面是在什么条件下没再出现是否覆盖原来的任务步骤、负载、姿态、环境和操作原问题发生时的异常路径是否重新验证记录模板原触发条件后续验证条件是否一致备注是 / 否3.2 “应该是这个原因”风险经验判断代替证据。追问根因证据在哪里哪些可能原因已经排除日志、波形、状态记录是否能说明先后顺序根因证据表怀疑原因支持证据排除证据当前判断待确认 / 较可能 / 已排除3.3 “改了参数现在正常了”风险参数可能压住现象也可能引入新的边界风险。追问为什么改这个参数改动前后的参数值是多少是否影响报警时机、任务节拍、安全边界或其他场景参数变更影响表参数修改前修改后修改原因影响面回归结果3.4 “先关闭后面再观察”风险没有负责人、指标和重新打开机制。追问观察周期多长谁负责观察看哪些指标什么情况下重新打开问题带条件观察记录观察项指标周期负责人重新打开标准3.5 “现场没反馈就算解决了”风险被动等待反馈不等于主动验证。追问现场是否覆盖原问题场景是否有日志或远程记录现场人员是否知道再次出现时要记录什么现场覆盖情况日志记录人员记录要求是否可用于关闭是 / 否4. 单变量验证建议问题关闭前尽量避免“同时改很多东西然后后面没再出现”。验证动作建议做法不建议做法参数调整一次只改一个主要参数记录改动前后同时改阈值、超时、状态逻辑硬件排查换线、换连接器、改固定方式要单独记录换线后同时更新程序软件修改明确修改分支和触发条件只写“优化异常处理”回归测试覆盖原触发条件和影响场景只跑最顺的正常流程5. 建议的问题关闭模板问题编号 问题标题 现象描述 首次发生时间 / 场景 触发条件 影响范围 根因判断 支持证据 已排除原因 修改动作 版本 / 参数 / 结构变更 验证条件 验证结果 影响面回归 是否允许关闭是 / 否 / 带条件观察 观察条件 负责人 重新打开标准6. 关闭判断建议满足以下条件后再关闭原问题现象已经被清楚定义原触发条件已被覆盖或有明确不能覆盖的说明根因判断有证据支持而不是只靠经验修改动作可追溯验证结果能支撑关闭影响面已经做过基本回归若转入观察已明确负责人、指标和重新打开标准。一句话总结问题解决了是现场恢复了问题关闭了是证据收住了。