## 目录过程轨、结构轨与 Epic 验收如何叠放 系列《AI 编程可闭环协作》· 方法论地图
| 节 | 标题 |
|---|---|
| — | 摘要 |
| 1 | 问题陈述:失败常不在模型 |
| 2 | 双主轴:过程轨与结构轨 |
| 3 | SDD 三支柱:Inform · Constrain · Verify |
| 4 | Epic:意图 · 成果 · 验收 |
| 5 | 记忆轨与 Skill 的边界 |
| 6 | L3 → L2 → L1:什么能抄、什么不能 |
| 7 | 与 TDD、Code Review、DevOps 的关系 |
| 8 | 阅读地图:五卷各答什么 |
| 9 | 诚实边界:本系列不承诺什么 |
| 10 | 结语 |
摘要
AI 写代码的交付质量,常见瓶颈 不在模型够不够强,而在两件事没补齐:改哪里、会影响谁 的结构化上下文,以及 何时算做完、凭什么合并 的验收闭环。
本方法论用两条 正交轨道 叠放:
结构轨(技术图谱:入口、依赖、契约与机器可核对)回答「从哪进、动哪片」;
过程轨(任务单、书面签收、合并前检查等 协作落点)与 结构轨(技术图谱)如何叠放,后文 §2 说明;Inform / Constrain / Verify 三支柱源于 规格驱动开发(SDD),后文 §3 展开。Harness 一词在本系列中指两种相近概念:业界讨论的 Harness Engineering(驾驭工程),以及本连载具体化的 「Harness 协作流程」(任务单、阶段流、合并前检查等)。后者是 实践 SDD 的一种工程化路径,不是 三支柱的定义来源。
过程轨回答「本趟敢不敢合、谁负责」。一轮有边界的交付(下文称 Epic)至少具备 意图、成果、验收 三要素;缺验收就不算收尾。
合完之后,可把教训 可选 蒸馏成经验卡片、团队 Skill 或 跨轮回顾摘要——它们像路口上的警示牌,不替代 地图与关卡。操作实例、对照实验与存量案例在连载 卷一~卷五;本文只给 可迁移的原则地图。
1. 问题陈述:失败常不在模型
许多团队已经习惯:自然语言描述需求 → Agent 改文件 → 人眼看 diff → 合并。然而即便换用更强、更贵的模型,往往仍会遇到:
| 现象 | 根因(简化) |
|---|---|
| 改 A 漏 B,联调才爆 | Agent 不知道系统结构 与依赖 |
| 同一需求反复解释 | 没有可复用的 规格与任务依据 |
| PR 能合但心里没底 | 缺少 书面签收 与 自动化验收 |
| 对话很长、账单很高 | 整仓或整段文档 灌给模型 |
与模型能力解耦:同一份任务单、同一张子图、同一套合并前检查,换 Auto 里不同档位的模型,交付口径仍可对齐——工具会变,意图 / 成果 / 验收 不应随模型脾气漂移。评测与 Mentor 类工作尤其需要这一点:你要教的是 可测的题面 + 可签收的结论 + 可复盘的轨迹,而不是某次对话里模型「看起来懂了」。
2. 双主轴:过程轨与结构轨
### 2.1 各答一问与 §3 的分工:双轨 是本系列的两类 落点(图谱 × 协作执行);Inform / Constrain / Verify 来自 SDD(§3)。Harness 是落实 SDD 的 工具/纪律层之一(任务单、阶段流、CI),勿与 SDD、勿与「过程轨」混成同一个词。
| 轨道 | 回答的问题 | 典型载体 |
|---|---|---|
| 过程轨 | 怎么协作、何时人审、本趟能否合并 | 任务单、审查记录、合并前检查全绿 |
| 结构轨 | 系统长什么样、从哪进、影响面在哪 | 技术图谱(主图 + 子图 + 契约/入口清单 + CI) |
两条轨 **正交**:同一 Epic 里,你可以既有「图谱入口:从登录子图进入」,又有「验收:单测 + lint 全绿 + Tech Lead 书面签收」——**指标不混表**(不能用「对话很短」代替「检查绿了」)。说明:结构轨表格中的 CI 指 图谱 CI——入口清单、契约锚点等 结构文档与代码一致性 的自动检查,不是替代合并前业务测试的流水线。
2.2 只炼 Skill 或只上 CI,各缺什么
| 做法 | 补上了什么 | 仍容易缺什么 |
|---|---|---|
| 只做 Skill / Rules | 个人或团队的 提问与编码习惯 | 改哪、影响谁;当次任务 书面验收 |
| 只做 CI / DevOps | 合并前的 机器背压 | Agent 开工前 挂错入口;任务 非范围 与 失败路径 未写清 |
| 只写 Wiki / 产品文档 | 业务规则与背景 | 与代码同步 的工程入口与契约;签收纪律 |
2.3 一段比喻(可选理解,非规范定义)
可以把协作想成工地运输:技术图谱 是带方向的道路图,规定从哪扇门进、会连到哪些工区;Agent 默认只领 一小张局部地图(具体形式见连载 卷二 §9),而不是背下整座城市。关卡 对应 SDD 三支柱里的 Verify(及过程轨上的签收):检查绿了没有、审查签了没有,过关才上主路。经验卡片或 Skill 是路口上的 警示牌——目的地仍在图上的 入口节点,不在牌子上。
3. SDD 三支柱:Inform · Constrain · Verify
规格驱动开发(Spec-Driven Development,SDD) 强调 先规格、后实现:用可执行的说明(Spec / 任务单)明确行为边界,再改代码,并以检查证明对齐。卷一的 意图 · 成果 · 验收 与 SDD 同向;卷三标题里的 「Harness 与 SDD」 指:SDD 是上层方法论,Harness(协作流程、阶段流、合并前检查)是 把 SDD 落到 AI 协作里的一种工程化路径——不是 三支柱的定义来源。
Inform(告知)· Constrain(约束)· Verify(验证) 是 SDD 语境下组织协作的 三支柱(卷一写作「告知 · 约束 · 验证」)。它们回答:开工前 告知 够不够、执行中 约束 能否核对、合并前 验证 能否重复。本系列 不发明 第四支柱;双轨(§2)只是把 SDD 三支柱 落实 到两类落点:
SDD(规格驱动 · 上层方法论)
└── ICV 三支柱(Inform / Constrain / Verify)
├──► 结构轨 · 技术图谱
└──► 过程轨 · 任务单、签收、合并前检查
(过程轨上常经 Harness 协作流程、Harness Engineering 等工具落实,非 ICV 的子节点)
图 1 · SDD、ICV、双轨与 Harness 的归属(Harness 落实 过程轨,不是 与 ICV 平级的第四支柱):
| 支柱(SDD / ICV) | 含义(读者向) | 过程轨落点 | 结构轨(图谱)落点 |
|---|---|---|---|
| Inform | 开工前说清读什么、范围与依据 | 任务单:背景、非范围、依赖说明 | 图谱入口;查询子图而非整仓灌文档 |
| Constrain | 边界与失败行为可规则化 | 失败路径、测试策略、拒开工清单 | 契约/入口清单;图谱与代码 门牌号一致 |
| Verify | 合并前可重复验证、可追责 | 合并前检查全绿、书面签收落盘 | export/入口/叙述层 CI;读法对照 带题集边界 |
二者 协同,但 不是同一套东西。SDD 讨论里也会出现「约束」「验证」等词,通常指 规格本身应具备的特征;而 ICV 在本系列中指 工程里可执行的组件与纪律(任务单字段、CI、签收),勿混读。
| 维度 | SDD(规格驱动开发) | Harness Engineering(驾驭工程) |
|---|---|---|
| 起源 | 传统软件工程:用契约与规格管理复杂性 | 近年围绕 LLM 的 外部工程化 讨论(如 Mitchell Hashimoto 提出概念、OpenAI Codex 团队实践等业界叙事) |
| 核心 | 先写清 Spec,再实现,保证实现与规格对齐 | 围绕 LLM 建 外部工程系统,引导、约束、验证 AI,把不稳定产出变成可合并交付 |
| 典型口号 | 先想后做,规格即契约 | 模型能力趋同时,工程系统(Harness) 决定能否稳定交付 |
| 与本连载 | Epic 三要素、任务单、验收 的 方法论父层;ICV 三支柱归属此处 | 卷三 Harness 协作流程、CI、书面签收等 实践层之一 |
| 关系 | 定义「要交付什么、如何验收」 | 实践 SDD 的工具之一;可与 SDD、敏捷等 并行叠加,非替代 SDD |
**为何容易混(三条)**:Harness Engineering「典型口号」一句为 业界讨论,非本系列独创。
- SDD 讨论里也会出现「约束」「验证」——多指 规格应具备的特征,不是 Harness 里的工程组件名。
- Harness 是实践 SDD 的路径之一(尤其把 Verify 落到 CI、签收),不是 Inform / Constrain / Verify 的定义来源。
- Harness Engineering 更像 独立工程话语,可与多种开发流程结合;本连载的「Harness 协作流程」与之同向,但落盘在 任务单 + 阶段流 + 检查,不绑定某一商业产品。
**Verify 加厚(评测向)**:Mentor 或评测团队关心的是 **验收证据**——验收项能否被测试或检查 **证伪**;协作过程是否留下 **可复盘轨迹**(谁、何时、基于什么材料签收)。这与「多堆对话日志当训练数据」不是一回事:日志若没有对齐 **意图 / 成果 / 验收**,很难还原「当时什么叫做完」。类比(秒懂):SDD ≈ 合同 + 验收标准;Harness ≈ 工地 闸机、巡检、签字——前者定交付与怎么验,后者把纪律落到协作现场(见图 1)。
「Harness」兼指业界 Harness Engineering 与本连载 任务单 + 阶段流 + 检查(卷三)。图谱轨 服务 SDD 的 Inform / Constrain(读哪里、契约一致)。
轨迹表述(抽象):开工前有任务依据;合并前有检查结论;关键节点有 书面记录(可检索,而非仅聊天窗口)。不用 合并率、单次 token 账单或「感觉差不多」充当 Epic 收尾标准。
与「只堆对话数据」的边界:训练或评测若只收集长对话,往往难以还原 当时 的验收标准与非范围。过程轨要求把 可失败 的验收项写进任务单,并把 检查结论与签收 留在仓库可检索处——这样事后分析的是 交付决策链,而不是聊天记录里的语气与猜测。
粒度对照(Mentor 向):
| 粒度 | 是什么 | 三要素是否必填 |
|---|---|---|
| 题集 / 作业 | 评测用的一题或一组题 | 每题应有可测意图、可验收成果 |
| Epic / 专题 | 工程上一包有边界的交付 | 必填 验收;可有多个 PR |
| 单次工单 / task | Epic 内的实现单元 | 继承 Epic 验收;可再加局部清单 |
4. Epic:意图 · 成果 · 验收
Epic 在本文中指:有边界的一包工程交付,而不是和模型无限续聊。它可以对应产品上的一个主题,也可以对应仓库里 一条任务链(一个主任务单 + 若干关联子任务)。再小的单次改动,也建议 具备三要素(可写在同一张任务单里):
| 要素 | 是什么 | 缺了会怎样 |
|---|---|---|
| 意图 | 要达成什么、明确不做什么 | Agent 与人都易 范围漂移 |
| 成果 | 可合并的代码、配置、文档、规则变更 | 「聊过了」但 无可合并物 |
| 验收 | 测试/检查通过 + 审查签收 + 关键结论可追溯 | 不敢合 或合了无法复盘 |
专题收尾(合并后的归档、可选摘要编译)属于 合之后 的纪律,见连载卷四;合并本身不自动生成 跨轮回顾摘要。
图 2 · 一轮 Epic 的简化交付链(端到端心智模型;不是 卷三完整阶段流或卷二主图+子图细节):
4.1 迷你题集示例(虚构 · 泛化)
下面 一题 展示「题集 / 作业」应如何写清三要素——可迁移写法,不是 某仓库的真题,不可整包照搬为你们的基准集(见 §6)。
题:为公开 HTTP API 增加按 IP 的速率限制
| 要素 | 内容 |
|---|---|
| 意图 | 降低滥用风险;对内部批处理通道 不适用 限流;非范围:不改鉴权模型、不改计费 |
| 成果 | 限流中间件 + 可配置阈值;统一错误响应形状;更新对外接口说明 |
| 验收 | 超限返回约定状态码;单测覆盖边界与过期配置;配置缺失时 使用默认值并记录告警(失败路径可复述;*仅为示例,非强制行为*);合并前检查全绿;审查书面签收 |
5. 记忆轨与 Skill 的边界
Skill、编辑器 Rules、经验卡片,在本框架里属于 习惯层或 Constrain 的延伸:减少重复 Prompt,统一命名与测试顺序。它们不替代:
- 结构轨:改架构仍要 改图谱(PR 顺手维护),不能只加 Skill;
- 过程轨:合并前检查 + 书面签收 不能省——在平台上点一下 Approve 不等于 本系列意义上的交付。
跨轮回顾摘要(从已收尾材料 编译 出的 Epic 级决策页)帮助半年后少翻冗长留痕;不是 产品 Wiki 全文,不能 代替图谱做影响分析。与 LLM Wiki、PRD 的分工,连载卷四 有表;此处只记一句:摘要/Wiki 层不替代「敢不敢合」的闸。
冷 / 温 / 热 在连载里指 协作记忆分层(结构地图 / 协作轨迹 / 远期运行时记忆),不是 软件架构里的三层。不是 架构冷层、温层、热层——若团队内部另有同名术语,请在术语表写清映射,避免与系列混用(详见 卷五 §23.1;总论不展开)。
6. L3 → L2 → L1:什么能抄、什么不能
| 层级 | 是什么 | 能否迁移 |
|---|---|---|
| L3 原则 | SDD 三支柱(ICV)、双轨叠放、Epic 三要素、验收纪律 | 可讲可教到 其他项目(SDD/ICV 可迁移;Harness 落盘与具体仓库路径、实验数字不可整包抄) |
| L2 做法 | 任务单字段名、合并前命令集合、图谱目录习惯 | 须 按栈改写(前端/后端/单体各不相同) |
| L1 实例 | 某仓路径、某次对照实验数字、gold 题集命中率 | 不可整包外推 到全行业或其他仓 |
7. 与 TDD、Code Review、DevOps 的关系
- TDD / 单测:仍负责「行为对不对」;本方法论负责「这次改动 有没有测试策略、失败路径写没写、敢不敢合并」。契约检查绿了,仍可能 行为逻辑错——门牌号对了,屋里逻辑还要靠测试(连载卷五 FAQ 有对照)。
- Code Review:过程轨(Verify + Inform)把「聊过」变成 可检索的审查记录;图谱让 Reviewer 更快看 影响面。
- CI/CD:Verify 的硬背压;Agent 自检 不能 代替流水线。
- Jira / 飞书工单:产品沟通层;任务单是 工程交付依据——宜 叠加,不宜再搞第三套互相打架的流程(存量降级见卷三)。
叠加,不替换:你没有 TDD 或 CI,应先补 「验得动」(哪怕先是手动门禁写进任务单),再谈 Agent 规模化。
8. 阅读地图:五卷各答什么
读完本文,可按处境选连载(均 无卷号依赖 于本篇,但卷二起建议顺序阅读):
| 读者处境 | 建议路径 | 本篇已够可停 |
|---|---|---|
| Mentor / 评测 / 教模型写代码 | 本文全文 → 卷三 Harness(Verify)→ 卷四 专题收尾与摘要 | 需要题集与轨迹细节时再下钻;本文 §4.1 可作出题模板 |
| 新项目 / 个人实验 | 本文 → 卷一 §6 最小起步 → 卷二 图谱 | 只要原则时可停;动手优先卷一模板 |
| 存量 / 老项目 | 本文 → 卷五 渐进路线 · 卷三无 CI 降级 | 勿先卷二物化细节;先「验得动」再铺图 |
| 只要 Agent 读架构 | 本文 §2~§3 → 卷二 技术图谱 | 可跳过 Harness 细则;仍建议知 §4 验收概念 |
| 只要敢合并 | 本文 §3~§4 → 卷三 → 卷四 §17 摘要 | 可跳过图谱实验数字;契约红了见卷四失败分支 |
| 卷 | 副标题(连载) | 你得到什么 |
| 卷一 | 怎样才算「做完」 | 动机、双轨总览、最小起步 |
| 卷二 | 技术图谱 | 子图、读法对照、图谱 CI |
| 卷三 | Harness 与 SDD | 实践 SDD 的 Harness 协作流程(任务单、签收、阶段流) |
| 卷四 | 闭环交付与经验沉淀 | 专题流水线、跨轮回顾摘要 |
| 卷五 | 存量怎么落地 | 案例机制、FAQ、阶段 0~3、诚实边界 |
9. 诚实边界:本系列不承诺什么
| 请勿外推为… | 实际范围 |
|---|---|
| 有图谱就不会幻觉 / 零 bug | 降低 漏改与漂范围;仍要单测、失败路径、签收 |
| 全自动无人值守交付 | 有闸的协作;关键节点人审 |
| 任意仓库、任意语言零配置 | 须 自建题集 与试点链;存量 渐进(阶段 0~3) |
| 对照实验降幅 = 全行业普适 | 须在 声明题集 + 单仓 + 场景 内解读;连载卷二/卷四有边界表述 |
| 维护图谱可忽略 | 作者在 小样本(约数名后端、每周数个任务、少量试点链)中,将图谱相关维护控制在开发时间 约 10%~15% 的目标区间——非行业标准、非 KPI、非承诺;过高应减项或加强自动化 |
| 增量图谱 CI 已成熟可照搬 | 现阶段强调 全量 export/入口与叙述层检查;增量 图谱 CI 未 作公众稿承诺 |
10. 结语
若你只想用 15 分钟建立全局心智:读完本文即可知道 SDD 与 ICV 三支柱、Harness 在其中的位置、双轨叠放、Epic 三要素 与 五卷分工。
若要动手:新读者从 卷一 最小起步;要地图读 卷二;要敢合并读 卷三;要合后沉淀读 卷四;老项目直接看 卷五 阶段 0,但仍建议 浏览 卷一~卷三要点。
SDD 定规格与验收,结构进图谱,过程经 Harness 等落实 ICV,习惯与决策合后再沉淀。 先认路,再干活,过关放行,再可选挂牌。
许可:CC BY 4.0 · 署名可转载与改编 · 系列文稿:ai-coding-closed-loop-articles