OpenAI大概率已经意识到,谁的Agent学会在链上世界自主生存,谁就拿到了下一阶段的入场券。OpenAI大概率已经意识到,谁的Agent学会在链上世界自主生存,谁就拿到了下一阶段的入场券。

OpenAI出了张Agent链上入学考卷

2026/02/19 16:03
阅读时长 8 分钟

作者:chao来源:X,@chaowxyz

--这不仅是合约能力测评,更是Agent的链上生存考试。

早上起床收到了一大堆私信,吓得我还以为AGI实现了。仔细看是OpenAI新发布了智能合约基准测试,简单讲讲这个。

一句话总结,Agent理解、修复和运用智能合约的能力,并不是用来抢加密安全公司饭碗的。在我看来,这些能力指向的是一个更根本的问题:Agent未来能否真正在加密环境中生存和行动。而OpenAI发布的evmbench,就是衡量这种生存能力的刻度尺。

过年在外面还来不及详细解读报告,简单速揽了一遍,初步感觉是:这是个有创新,但总体还比较早期和简陋的benchmark。

基准使用了现实世界中40个真实项目里发生的120个高危漏洞 。

考试分三科:科目一:找茬。寻找漏洞。科目二:修补。给它有漏洞的代码,让它把漏洞修好 。科目三:攻击,AI 扮演黑客,在一个本地搭建的环境里,给通过操作加密钱包进行攻击。更具体的技术层不展开了,相比evmbench的方法论和题目细节本身,我更感兴趣的是为什么OpenAI会发布这个。

过去几年间,OpenAI并未特别展现出对加密领域的兴趣。这次发布里显然有加密VC Paradigm在推波助澜,Paradigm的动机自然不难理解,但发表的第一作者署名是OpenAI,这说明OpenAI不只是被动配合,而是有主动意愿的。

那这个意愿从哪里来?

一个直接的解释是这是OpenAI内部Preparedness Framework的延伸,评估前沿模型在高风险场景下的能力边界,智能合约安全只是其中一个部分。但这显然不是全部。

Agent利用加密网络,不只是一种可能性,某种程度上是一种必然。OpenAI当然也看得到这一点。在发布报告里也很明确提到 "we expect agentic stablecoin payments to grow"

但我认为这个命题并不止于Agent支付。我们现在讨论的Agent,大多数还是工具属性的,人发出指令,Agent执行,结果返回给人。但这个形态不会是终点。当Agent的数量足够多、能力足够强,它们之间显然会开始直接协作:一个Agent雇佣另一个Agent完成子任务,一个Agent向另一个Agent购买数据或算力,一个Agent代表某个组织与另一个组织的Agent谈判、签约、履约。

人退出了交易的中间环节。

这时候一个根本问题浮出水面:当人不再居中,这套经济体系靠什么运转?

人类社会解决信任和协作,靠的是几千年碳基文明积累出来的一套体系,法律、声誉、机构担保等等。但这套体系的底层逻辑是为人设计的:参与方有持续身份,有社会后果,有被追责的可能。Agent天然不满足这个前提。它可以一秒发起千笔交易,可以随时销毁重建身份,可以无视任何司法边界。 有人会说,那就把Agent和人类身份强行绑定,用人类授权来做担保。但这等于把一套为碳基生命设计的枷锁,套在一个运行速度和规模完全不同的物种身上,不只是低效,而是从根本上误解了Agent是什么。更何况,Agent的演化方向必然指向更高的自主性。未来的Agent很可能不依附于任何人类个体,没有"主人",没有可以绑定的人类身份,它就是独立的行动者。到那时,这套绑定逻辑连锚点都找不到。 把人类的信任基础设施套在Agent社会上,就像用马车的路规来管飞机。Agent社会需要自己的基础设施。

智能合约提供了这种可能。它不依赖"你相信对方会履约",而是把履约条件写进代码,由网络强制执行。没有仲裁员,没有等待期,条件触发,结果自动发生。

更进一步,智能合约可能不只是结算工具,而是Agent组织形态本身——治理规则、资源分配、任务调度,全部在链上定义,执行靠代码,不需要任何人居中。

而当一部分Agent就生活在链上,与各种合约交互本身就是它每一天的全部。如何读懂一份合约,如何在复杂的协议里找到自己的位置,如何识别陷阱、规避风险、在这个没有客服、没有申诉、没有撤销键的世界里活下去。这一切依赖的,都是对合约的理解和运用。能力不够,就是真实的损失,判断失误,就是永久的。

所以回头看EVMbench,它测的能力,读懂合约、发现漏洞、构造交易、执行攻击,本质上是在回答一个问题:Agent是否已经学会做这个新世界生存。

OpenAI大概率已经意识到,谁的Agent学会在链上世界自主生存,谁就拿到了下一阶段的入场券。更进一步,未来的agent可能已经不能用谁的来形容。他们也许就是独立的个体。

来源:金色财经

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。