Anthropic提出强监管框架：为前沿AI设安全红线

2026-06-11 05:45:24

Anthropic倡议构建前沿AI安全监管体系

该公司推出一套综合性的政策蓝图，旨在应对日益增长的先进人工智能系统所带来的潜在威胁。该框架涵盖安全评估、经济影响缓冲及关键基础设施防护等多个维度，呼吁立法机构赋予监管部门阻止或威慑高风险部署的能力。

推动政府主导的模型安全审查机制

在“AI指数政策”框架下，Anthropic提出双轨策略：一是聚焦于超级智能系统的《先进AI框架》，二是关注劳动者转型与利益共享的《经济政策框架》。公司指出，当前技术演进速度远超现有治理体系的响应能力，亟需强化政府干预权限。

设定高门槛以界定监管对象

提案将监管范围限定于训练量超过10²⁵次浮点运算的模型，以及年收入或研发支出突破5亿或10亿美元的企业。其重点防范四大类风险：生物工程滥用、大规模网络安全漏洞挖掘、系统脱离人类控制，以及自动化科研引发的连锁效应。其中，生物风险包括病毒设计与药物研发双重用途；网络风险则可能危及医疗系统、电力网络等核心设施。

强化开发者责任与独立监督机制

所有前沿模型发布前须完成独立验证，并提交包含摘要、安全架构和系统卡在内的完整报告。独立评估机构将承担审查职责，且需获得访问原始模型数据的权限。企业必须维护全面的安全计划，保护训练环境免受内外部攻击。此外，公开披露核心安全措施成为基本要求，必要时向监管机构提供详细资料。

构建社会抗风险能力基础

框架第二部分聚焦公共韧性建设，建议建立基因合成筛查机制、早期疾病预警系统、防护物资储备库，并研发减少空气传播路径的技术。在网络层面，需提升软件安全性，推动关键设施升级换代，设立专门部门追踪高端网络攻击能力。同时，呼吁建立可快速识别、阻断或关闭异常系统的应急工具链，以应对失控或自我迭代的高阶模型带来的未知挑战。

一分钟读懂：Anthropic发布全新AI治理提案，主张建立针对先进模型的独立审查机制与强制测试制度，强调政府应具备遏制危险部署的权力，并推动经济适应与社会韧性建设。

Anthropic提出强监管框架：为前沿AI设安全红线

Anthropic倡议构建前沿AI安全监管体系

推动政府主导的模型安全审查机制

设定高门槛以界定监管对象

强化开发者责任与独立监督机制

构建社会抗风险能力基础

猜你喜欢

深度关联