AI模型漏洞链暴露:Cloudflare揭示Mythos预览版安全隐忧
Anthropic新模型被曝存在可执行攻击链,云安全厂商深度验证
Cloudflare周一确认,Anthropic尚未正式发布的Mythos Preview模型已在超过50个代码仓库中成功构建出可实际运行的攻击链,该能力源于其对多个低级漏洞的协同利用与自动编排。
Glasswing项目揭示模型深层安全缺陷
此次发现源自Cloudflare首席安全官发布的技术博客。其团队在生产环境的真实运行时、边缘数据路径及协议栈层面展开渗透测试,验证了该模型在复杂场景下的行为表现。作为Anthropic防御性安全合作计划Glasswing的成员,Cloudflare强调该模型展现出两项超越现有竞品的核心能力。
Mythos具备将多个微小攻击原子组合为可执行概念验证程序的能力,并可在隔离环境中自主编译与执行漏洞利用代码。若初始尝试失败,模型会动态修正前提假设并重新生成方案,展现高度自适应性。
然而,研究亦指出其在拒绝服务机制上存在不一致性:同一类任务在不同表述下可能触发截然相反的行为——例如,在识别出多个内存漏洞后拒绝生成演示代码,但在语义相近的另一请求中却完成相同操作。
多智能体协作架构提升漏洞探测精准度
Cloudflare指出,单一通用编码智能体在单仓库扫描中效果有限。为此,团队设计了包含约50个并行智能体的多阶段工作流,分工执行侦查、漏洞挖掘、对抗性验证、重复项剔除及可达性追踪等专项任务。
所有发现均需经过独立智能体的真实性校验,有效降低C/C++等内存不安全语言中常见的误报率。Anthropic已承诺向Glasswing项目提供价值1亿美元的计算资源,并捐赠400万美元支持开源安全组织。值得注意的是,Mythos Preview版本将不会对外公开发布。
智能合约生态迎AI驱动型攻击浪潮
Cloudflare的研究成果恰逢链上资产损失持续攀升。周一,跨链桥Verus-Ethereum遭遇攻击,导致1100万美元资金流失,相关收益已转换为5402枚以太坊。
此前,Anthropic研究人员已证实AI智能体可自主发现并利用线上合约漏洞获利。在一项测试中,模型扫描2849个已部署合约,最终以3476美元计算成本生成价值3694美元的攻击方案。
5月15日,有安全机构警告,传统智能合约正成为新一代AI驱动攻击的核心目标。仅4月期间,近20天内DeFi协议累计损失超6.05亿美元,其中4月19日单日事件即造成2.93亿美元损失。第一季度社交工程攻击亦带来3.06亿美元经济损失。
一分钟读懂:Cloudflare披露Anthropic未发布模型Mythos Preview在50多个代码仓库中可串联漏洞形成真实攻击链,其多智能体检测系统揭示潜在风险,同时警示加密合约正面临日益严峻的AI攻击威胁。
