Anthropic提出强监管框架:为前沿AI设安全红线
2026-06-11 05:45:24
Anthropic倡议构建前沿AI安全监管体系
该公司推出一套综合性的政策蓝图,旨在应对日益增长的先进人工智能系统所带来的潜在威胁。该框架涵盖安全评估、经济影响缓冲及关键基础设施防护等多个维度,呼吁立法机构赋予监管部门阻止或威慑高风险部署的能力。
推动政府主导的模型安全审查机制
在“AI指数政策”框架下,Anthropic提出双轨策略:一是聚焦于超级智能系统的《先进AI框架》,二是关注劳动者转型与利益共享的《经济政策框架》。公司指出,当前技术演进速度远超现有治理体系的响应能力,亟需强化政府干预权限。
设定高门槛以界定监管对象
提案将监管范围限定于训练量超过10²⁵次浮点运算的模型,以及年收入或研发支出突破5亿或10亿美元的企业。其重点防范四大类风险:生物工程滥用、大规模网络安全漏洞挖掘、系统脱离人类控制,以及自动化科研引发的连锁效应。其中,生物风险包括病毒设计与药物研发双重用途;网络风险则可能危及医疗系统、电力网络等核心设施。
强化开发者责任与独立监督机制
所有前沿模型发布前须完成独立验证,并提交包含摘要、安全架构和系统卡在内的完整报告。独立评估机构将承担审查职责,且需获得访问原始模型数据的权限。企业必须维护全面的安全计划,保护训练环境免受内外部攻击。此外,公开披露核心安全措施成为基本要求,必要时向监管机构提供详细资料。
构建社会抗风险能力基础
框架第二部分聚焦公共韧性建设,建议建立基因合成筛查机制、早期疾病预警系统、防护物资储备库,并研发减少空气传播路径的技术。在网络层面,需提升软件安全性,推动关键设施升级换代,设立专门部门追踪高端网络攻击能力。同时,呼吁建立可快速识别、阻断或关闭异常系统的应急工具链,以应对失控或自我迭代的高阶模型带来的未知挑战。
一分钟读懂:Anthropic发布全新AI治理提案,主张建立针对先进模型的独立审查机制与强制测试制度,强调政府应具备遏制危险部署的权力,并推动经济适应与社会韧性建设。
