阶段思考 · 2026-04-01 · 从"做加法"到"做减法和加固"
dot1x 项目没做状态矩阵分析就批量创建,66 条用例全部返工。此后硬编码了"批量创建前必须等人确认"的阻断规则。dot1x 之后所有项目再未出现批量返工。
Phase 0 的五步标准动作,每一步都需要人工判断:
审计规则的自动生成:Phase 0 已经产出了维度拆解和状态组合表,但审计规则配置仍然是手写的。从"Phase 0 产物"到"Phase 2 审计"之间存在断裂。
全局公共用例识别:审计器识别不了 51401/51403 等全局公共用例,会误报为 COMMON_MISSING。修复方案已明确但未落地。
case-debugger 的定位从一开始就是"创建样本后立即跑审计,0 偏差才放行批量"。审计被定位为 CI lint 而不是事后 hotfix。链路:公共步骤创建 → 样本用例创建 → contract_smoke → case-debugger 审计 → 批量生成。
知识库结构校验:145 条公共用例 JSON 没有 schema 校验,同步脚本出 bug 可能写入缺字段的 JSON。人在"创建样本 → 跑审计"这一步无法感知数据层已损坏,错误会延迟到批量创建阶段才暴露。
复盘中明确识别了 6 类无用功:Lark 过度拆分、agent_service 空转、POC 停滞、skill 发现系统解决不存在的问题、早期专题脚本重复、平台 client 拆分建议。无效投入的共性:解决了一个不存在的问题。
"不做"的边界判断:什么该砍、什么该留,不是技术问题而是判断问题。Lark 5 模块砍到 2 个是对的,但当时怎么知道"2 个就够了"?判断标准是"覆盖 90% 使用场景的模块数"——这个 90% 的阈值本身也需要定期验证。