todayonchain.com

Claude Mythos 破解了 73% 此前 AI 无法解决的专家网络任务

BeInCrypto
Anthropic 的 Claude Mythos Preview AI 在此前 AI 无法解决的专家网络任务上取得了 73% 的成功率。

内容摘要

根据英国 AI 安全研究所 (AISI) 的评估,Anthropic 的 Claude Mythos Preview AI 已成为首个成功完成完整模拟企业网络攻击的 AI 模型。该模型在此前任何 AI 都无法解决的专家级夺旗赛任务上取得了 73% 的成功率。在一个 32 步的企业网络攻击模拟中,Mythos Preview 平均完成了 22 步,显著优于 Claude Opus 4.6。Anthropic 还报告称,Claude Mythos Preview 在被指示时可以检测和利用零日漏洞。由于其先进的能力,Anthropic 没有公开发布该模型,而是将其用于安全研究。这些发现已引发高级别讨论,包括美国财政部长 Scott Bessent 和美联储主席 Jerome Powell 与主要银行 CEO 的会议,讨论潜在的网络风险。AISI 建议组织优先考虑基础网络安全措施。

(来源:BeInCrypto)