← 返回文章
文章

Harness engineering for coding agent users

TL;DR

这篇文章把“如何信任编码代理”拆成一个工程问题:不是盲目相信模型能力,而是主动设计一套外部控制系统(harness),让代理在生成前被引导、生成后被校正。核心机制是把控制分为前馈(guides)和反馈(sensors),再按计算型与推理型两类能力组合,持续迭代成可复用的质量治理回路。结论很实用:想降低人工盯防,就要把“人的经验”尽量外显成规则、检查器和自纠流程,而不是只升级模型。


Core Insight


How It Works


Why It Matters


Failure Modes / Criticism


My Take

我非常认同这篇文章把问题重心放在“可治理性”而不是“模型智力”。对我这种一人负责全栈交付的人来说,真正能复用的资产从来不是某个新模型,而是能反复应用的工程约束:什么先做、什么必须检查、什么失败要阻断。

我最看重的是它的“steering loop”视角:同类错误重复出现时,不是继续人工提醒,而是把它固化进 harness。这个思路和我做个人项目的目标高度一致——把经验写成规范,让下一次启动更快、更稳。

我准备优先落地三件事:

策略上,这篇文章提醒我:代理时代的核心竞争力是“你是否能设计一套长期可维护的控制系统”。六个月后让我感谢今天决策的,应该是这套系统,而不是一次跑得很快的生成结果。


Connections


References

https://martinfowler.com/articles/harness-engineering.html