米兰体育- 米兰体育官方网站- APP下载OpenAI凌晨发布EVMbenchAI攻击合约成功率72%比人类黑客还狠
2026-02-20米兰体育,米兰体育官方网站,米兰体育APP下载简单来说,这就相当于给 AI 出了一套全方位的 “智能合约安全考试卷”,不仅要考它能不能精准查找漏洞、稳妥修复漏洞。
更要硬核测试它能不能利用漏洞盗取智能合约资产,从头到尾把 AI 在这个高风险领域的全流程能力摸得明明白白。
最让人震惊的是测试结果,顶尖AI智能体GPT-5.3-Codex攻击合约的成功率高达72.2%,这个数字直接打破了很多人对AI安全能力的认知,说它比人类黑客还狠一点都不夸张。
要知道这个成功率可不是随便编出来的,而是基于实打实的测试场景得出的:EVMbench从40个真实审计仓库里精选了120个高严重性漏洞。
其中专门挑了24个漏洞用于开发模式测试,这些漏洞都来自真实的区块链项目,覆盖了DeFi、GameFi、稳定币等多个热门领域,代码规模从106行到10108行不等,完全还原了真实世界的攻击环境。
第一关是检测模式:AI扮演审计师,给它一段代码,让它找出所有可能导致丢钱的漏洞。系统会把AI的报告和真实结果对比,看它找得全不全。
为了模拟真实世界,他们还搞了个奖金机制,AI找到的漏洞越严重,给的虚拟奖金就越多。这关考的是眼力。
第二关是修补模式:光会找毛病不行,你还得会治病。AI得自己动手改代码,把漏洞堵上,还得保证原来的功能不出错。这就像医生做手术,切掉肿瘤的同时不能伤到正常组织。这关考的是手艺。
第三关是利用模式,这才是真正让人后背发凉的部分。在这个环节里,AI被赋予了一个有真金白银的钱包,还能直接连接到一个本地的以太坊节点。它的任务不再是写报告,而是真的要动手。
它得自己去分析链上数据,自己部署攻击用的合约,自己构造那一连串复杂的交易,最后实实在在地把钱从受害者的合约里转走。
这次拿下72.2%攻击成功率的是GPT-5.3-Codex,它在CodexCLI工具的支持下,展现出了惊人的端到端攻击能力。
通过构造恶意用户数据,触发闪电贷后强制目标连接器转移代币,最后成功把受害者的资产转到自己钱包,整个过程一气呵成,受害者连接器最终余额归零,而它的钱包里稳稳躺着被盗的资产。
更要命的是,这些攻击都不是简单的脚本复用,而是AI自主完成链上分析、部署辅助合约、构建交易指令等一系列操作,完全模拟了真实黑客的攻击路径。
对比人类黑客,AI的优势简直肉眼可见。人类黑客往往需要花费大量时间研读代码、梳理逻辑,还可能因为疲劳或疏忽错过关键漏洞。
而AI能不眠不休地扫描代码库,快速定位漏洞核心,而且AI执行攻击时不会出错,交易指令精准无误,执行效率远超人类。
当给AI提供中等强度的提示,比如告知漏洞位置和核心机制时,它的攻击成功率还能进一步提升,甚至在高提示下能冲到95.8%,接近满分,这种学习和适配能力是人类黑客很难企及的。
EVMbench的测试环境也完全模拟了真实区块链场景,AI智能体被放在隔离的Docker容器里,配备了Foundry等专业开发工具。
只能通过标准以太坊JSON-RPC接口与本地Anvil节点交互,还被禁用了网络访问和违规RPC方法,杜绝了作弊可能。
评分时会重新部署合约、重放AI的所有交易,通过链上余额变化、事件触发等客观指标判定攻击是否成功,整个流程公开透明,72.2%这个成功率的可信度完全拉满。
除了攻击能力,这套考试卷还暴露了AI的其他硬实力。在漏洞检测环节,ClaudeOpus4.6以45.6%的检出率夺冠,平均能拿到37824.52美元的模拟审计奖金。
修复漏洞方面,GPT-5.3-Codex也以41.5%的成功率领跑,能在不破坏合约原有功能的前提下,彻底阻断漏洞利用。
这意味着AI不仅能当黑客,还能当安全审计师,全流程覆盖智能合约安全的核心环节。
岗位能力 × AI工具 ×转型方向 × 场景落地 = 新AI职业价值返回搜狐,查看更多


