AI模型漏洞链暴露：Cloudflare揭示Mythos预览版安全隐忧

2026-05-20 01:42:20

Anthropic新模型被曝存在可执行攻击链，云安全厂商深度验证

Cloudflare周一确认，Anthropic尚未正式发布的Mythos Preview模型已在超过50个代码仓库中成功构建出可实际运行的攻击链，该能力源于其对多个低级漏洞的协同利用与自动编排。

此次发现源自Cloudflare首席安全官发布的技术博客。其团队在生产环境的真实运行时、边缘数据路径及协议栈层面展开渗透测试，验证了该模型在复杂场景下的行为表现。作为Anthropic防御性安全合作计划Glasswing的成员，Cloudflare强调该模型展现出两项超越现有竞品的核心能力。

Mythos具备将多个微小攻击原子组合为可执行概念验证程序的能力，并可在隔离环境中自主编译与执行漏洞利用代码。若初始尝试失败，模型会动态修正前提假设并重新生成方案，展现高度自适应性。

然而，研究亦指出其在拒绝服务机制上存在不一致性：同一类任务在不同表述下可能触发截然相反的行为——例如，在识别出多个内存漏洞后拒绝生成演示代码，但在语义相近的另一请求中却完成相同操作。

Cloudflare指出，单一通用编码智能体在单仓库扫描中效果有限。为此，团队设计了包含约50个并行智能体的多阶段工作流，分工执行侦查、漏洞挖掘、对抗性验证、重复项剔除及可达性追踪等专项任务。

所有发现均需经过独立智能体的真实性校验，有效降低C/C++等内存不安全语言中常见的误报率。Anthropic已承诺向Glasswing项目提供价值1亿美元的计算资源，并捐赠400万美元支持开源安全组织。值得注意的是，Mythos Preview版本将不会对外公开发布。

Cloudflare的研究成果恰逢链上资产损失持续攀升。周一，跨链桥Verus-Ethereum遭遇攻击，导致1100万美元资金流失，相关收益已转换为5402枚以太坊。

此前，Anthropic研究人员已证实AI智能体可自主发现并利用线上合约漏洞获利。在一项测试中，模型扫描2849个已部署合约，最终以3476美元计算成本生成价值3694美元的攻击方案。

5月15日，有安全机构警告，传统智能合约正成为新一代AI驱动攻击的核心目标。仅4月期间，近20天内DeFi协议累计损失超6.05亿美元，其中4月19日单日事件即造成2.93亿美元损失。第一季度社交工程攻击亦带来3.06亿美元经济损失。

一分钟读懂：Cloudflare披露Anthropic未发布模型Mythos Preview在50多个代码仓库中可串联漏洞形成真实攻击链，其多智能体检测系统揭示潜在风险，同时警示加密合约正面临日益严峻的AI攻击威胁。