AI模型漏洞链暴露:Cloudflare揭示Mythos预览版安全隐忧

Anthropic新模型被曝存在可执行攻击链,云安全厂商深度验证

Cloudflare周一确认,Anthropic尚未正式发布的Mythos Preview模型已在超过50个代码仓库中成功构建出可实际运行的攻击链,该能力源于其对多个低级漏洞的协同利用与自动编排。

Glasswing项目揭示模型深层安全缺陷

此次发现源自Cloudflare首席安全官发布的技术博客。其团队在生产环境的真实运行时、边缘数据路径及协议栈层面展开渗透测试,验证了该模型在复杂场景下的行为表现。作为Anthropic防御性安全合作计划Glasswing的成员,Cloudflare强调该模型展现出两项超越现有竞品的核心能力。

Mythos具备将多个微小攻击原子组合为可执行概念验证程序的能力,并可在隔离环境中自主编译与执行漏洞利用代码。若初始尝试失败,模型会动态修正前提假设并重新生成方案,展现高度自适应性。

然而,研究亦指出其在拒绝服务机制上存在不一致性:同一类任务在不同表述下可能触发截然相反的行为——例如,在识别出多个内存漏洞后拒绝生成演示代码,但在语义相近的另一请求中却完成相同操作。

多智能体协作架构提升漏洞探测精准度

Cloudflare指出,单一通用编码智能体在单仓库扫描中效果有限。为此,团队设计了包含约50个并行智能体的多阶段工作流,分工执行侦查、漏洞挖掘、对抗性验证、重复项剔除及可达性追踪等专项任务。

所有发现均需经过独立智能体的真实性校验,有效降低C/C++等内存不安全语言中常见的误报率。Anthropic已承诺向Glasswing项目提供价值1亿美元的计算资源,并捐赠400万美元支持开源安全组织。值得注意的是,Mythos Preview版本将不会对外公开发布。

智能合约生态迎AI驱动型攻击浪潮

Cloudflare的研究成果恰逢链上资产损失持续攀升。周一,跨链桥Verus-Ethereum遭遇攻击,导致1100万美元资金流失,相关收益已转换为5402枚以太坊。

此前,Anthropic研究人员已证实AI智能体可自主发现并利用线上合约漏洞获利。在一项测试中,模型扫描2849个已部署合约,最终以3476美元计算成本生成价值3694美元的攻击方案。

5月15日,有安全机构警告,传统智能合约正成为新一代AI驱动攻击的核心目标。仅4月期间,近20天内DeFi协议累计损失超6.05亿美元,其中4月19日单日事件即造成2.93亿美元损失。第一季度社交工程攻击亦带来3.06亿美元经济损失。