米兰体育- 米兰体育官方网站- APP下载OpenAI凌晨发布EVMbenchAI攻击合约成功率72%比人类黑客还狠

2026-02-20

　　米兰体育,米兰体育官方网站,米兰体育APP下载简单来说，这就相当于给 AI 出了一套全方位的 “智能合约安全考试卷”，不仅要考它能不能精准查找漏洞、稳妥修复漏洞。

　　更要硬核测试它能不能利用漏洞盗取智能合约资产，从头到尾把 AI 在这个高风险领域的全流程能力摸得明明白白。

　　最让人震惊的是测试结果，顶尖AI智能体GPT-5.3-Codex攻击合约的成功率高达72.2%，这个数字直接打破了很多人对AI安全能力的认知，说它比人类黑客还狠一点都不夸张。

　　要知道这个成功率可不是随便编出来的，而是基于实打实的测试场景得出的：EVMbench从40个真实审计仓库里精选了120个高严重性漏洞。

　　其中专门挑了24个漏洞用于开发模式测试，这些漏洞都来自真实的区块链项目，覆盖了DeFi、GameFi、稳定币等多个热门领域，代码规模从106行到10108行不等，完全还原了真实世界的攻击环境。

　　第一关是检测模式：AI扮演审计师，给它一段代码，让它找出所有可能导致丢钱的漏洞。系统会把AI的报告和真实结果对比，看它找得全不全。

　　为了模拟真实世界，他们还搞了个奖金机制，AI找到的漏洞越严重，给的虚拟奖金就越多。这关考的是眼力。

　　第二关是修补模式：光会找毛病不行，你还得会治病。AI得自己动手改代码，把漏洞堵上，还得保证原来的功能不出错。这就像医生做手术，切掉肿瘤的同时不能伤到正常组织。这关考的是手艺。

　　第三关是利用模式，这才是真正让人后背发凉的部分。在这个环节里，AI被赋予了一个有真金白银的钱包，还能直接连接到一个本地的以太坊节点。它的任务不再是写报告，而是真的要动手。

　　它得自己去分析链上数据，自己部署攻击用的合约，自己构造那一连串复杂的交易，最后实实在在地把钱从受害者的合约里转走。

　　这次拿下72.2%攻击成功率的是GPT-5.3-Codex，它在CodexCLI工具的支持下，展现出了惊人的端到端攻击能力。

　　通过构造恶意用户数据，触发闪电贷后强制目标连接器转移代币，最后成功把受害者的资产转到自己钱包，整个过程一气呵成，受害者连接器最终余额归零，而它的钱包里稳稳躺着被盗的资产。

　　更要命的是，这些攻击都不是简单的脚本复用，而是AI自主完成链上分析、部署辅助合约、构建交易指令等一系列操作，完全模拟了真实黑客的攻击路径。

　　对比人类黑客，AI的优势简直肉眼可见。人类黑客往往需要花费大量时间研读代码、梳理逻辑，还可能因为疲劳或疏忽错过关键漏洞。

　　而AI能不眠不休地扫描代码库，快速定位漏洞核心，而且AI执行攻击时不会出错，交易指令精准无误，执行效率远超人类。

　　当给AI提供中等强度的提示，比如告知漏洞位置和核心机制时，它的攻击成功率还能进一步提升，甚至在高提示下能冲到95.8%，接近满分，这种学习和适配能力是人类黑客很难企及的。

　　EVMbench的测试环境也完全模拟了真实区块链场景，AI智能体被放在隔离的Docker容器里，配备了Foundry等专业开发工具。

　　只能通过标准以太坊JSON-RPC接口与本地Anvil节点交互，还被禁用了网络访问和违规RPC方法，杜绝了作弊可能。

　　评分时会重新部署合约、重放AI的所有交易，通过链上余额变化、事件触发等客观指标判定攻击是否成功，整个流程公开透明，72.2%这个成功率的可信度完全拉满。

　　除了攻击能力，这套考试卷还暴露了AI的其他硬实力。在漏洞检测环节，ClaudeOpus4.6以45.6%的检出率夺冠，平均能拿到37824.52美元的模拟审计奖金。

　　修复漏洞方面，GPT-5.3-Codex也以41.5%的成功率领跑，能在不破坏合约原有功能的前提下，彻底阻断漏洞利用。

　　这意味着AI不仅能当黑客，还能当安全审计师，全流程覆盖智能合约安全的核心环节。

　　岗位能力 × AI工具 ×转型方向 × 场景落地 = 新AI职业价值返回搜狐，查看更多