文章作者、来源:凯莉彭
又双叒叕造了个词
如果你关注 AI,那么你最近也许会老听到这么一个词:Harness Engineering。
打开推特、刷公众号,到处都是它。OpenAI 发文章、Anthropic 跟进、HashiCorp 的创始人在博客里推、Martin Fowler 在专栏里写。两个月之内,这个词从无人知晓变成了 AI 行业的核心词汇。
我看到的第一反应是:又一个我没跟上的概念。
老实说,我对这种感受已经有点免疫了。AI 这两年特别擅长造词:Prompt Engineering(提示词工程)、Context Engineering(上下文工程)、Agent(智能体)、RAG(检索增强生成)、MCP……
每隔一段时间,就冒出来一个新名词,配着一句潜台词:"如果你不懂这个,你就落后了。"
研究完 Harness Engineering 之后,我想跟你说:
这个词没有那么神秘。事实上,你大概率早就在做这件事了,只是你不知道它叫这个名字。
今天这篇文章,就来详细聊聊这件事。
Harness 这个词,英文原意是马具,指的是给马套上的那一整套装备:缰绳、马鞍、嚼子、笼头。
马的特点是什么?有力气、跑得快。如果你放它自己跑,它会冲进邻居家的菜地、跑丢、撞墙。但套上马具之后,就可以让它精准地拉着马车走在你想走的路上。
把这个画面记住,因为 AI 圈现在就在用这个比喻。
行业里大家越来越喜欢用一个公式来描述现在的 AI 系统:
一个真正能干活的 AI 助手 = 模型本身 + 围绕模型搭建的整套控制系统
模型就是那匹"马"。比如 GPT、Claude、Gemini,它们提供的是智力,是推理和生成的能力。
而 Harness则是那身"马具",也就是套在模型外面的一整套东西。规则、检验机制、可用的工具、可查的资料、出错时的反馈回路。
它告诉 AI 什么可以做、什么不能做,让 AI 知道自己做得对不对,在 AI 出错时让它能自我纠正。
模型负责"会做",Harness 负责"做对"。
打个更接地气的比方:模型像一个非常聪明、但完全不熟悉你公司情况的实习生。Harness 就是你给这个实习生准备的"员工手册 + 工作规范 + 自动检查清单 + 出错就响的报警器"。
光有聪明的实习生没用,因为他不知道你们公司的规矩、不知道哪些事不能做、做错了也没人提醒他。你得给他套上一整套规则,他才能真正帮你把活干好。
铺垫完了,用一句话来定义一下:
Harness Engineering:你不在"让 AI 这一次做对"上花力气,而是在"让 AI 下一次、下下次、永远都不再做错这件事"上花力气。
或者用更精确一些:把 AI 犯过的某次错,永久写进它的运行环境里,让同样的错从机制上不可能再发生。
这个定义里有三个关键词,缺一不可。
一,它针对的是反复发生的问题,不是一次性的小失误。
二,解决方式是修改环境、规则、工具,不是重新跟 AI 说一遍。
三,效果是永久的、机制性的,不是这次说对了下次还得再说。
下次你跟 AI 互动时,如果它做错了某件事,试试多问自己一个问题:
"我是在治这次的病,还是在断这个病的根?"
治这次的病 = 在对话里重新解释、重新提示、让它重做一遍。这不是 Harness。
断这个病的根 = 修改它的工作环境,让它从此不会再犯。这就是 Harness。
讲到这里,我猜你已经隐隐有点感觉到


