OpenAI推锁定模式:严控数据外泄风险

OpenAI上线锁定模式应对敏感数据泄露威胁

OpenAI正逐步向个人及企业用户推送一项名为“锁定模式”的可选安全机制。该功能专为处理高敏感信息的用户设计,旨在通过切断ChatGPT对外部服务的访问权限,降低因提示词注入攻击引发的数据外流风险。

构建数据隔离屏障,阻断外部交互链路

启用锁定模式后,系统将自动关闭实时网络搜索、深度研究、代理连接以及文件下载等依赖外部数据的功能,彻底中断模型与外部信息源的直接交互。所有查询结果仅限于本地缓存内容,可能导致信息不完整或过时;同时,网络图像检索功能也将被禁用,但用户仍可上传图片并使用图像生成服务。

明确功能禁用范围与潜在局限性

具体受限项目包括画布代码的在线访问能力,以及部分依赖外部接口的集成体验,如金融分析工具与购物代理功能。值得注意的是,该模式无法完全消除已加载内容中潜藏的恶意指令影响,若缓存页面或上传文件内含隐蔽指令,仍可能诱导模型输出异常响应。其核心作用在于在数据外泄的最后一环设置防护,防止被窃取信息经由系统传至攻击者。

目标用户群体与账户覆盖范围

根据官方文档说明,锁定模式并非面向全体用户,默认仅适用于需严格管控提示词注入风险的个人及组织。免费版、Go版、Plus版和Pro版的个人账户均可启用,商业账户亦在支持范围内。功能推广采用渐进式部署策略,未在设置中发现选项的用户应等待后续更新。企业管理员可自定义角色权限,并精准分配给特定成员或部门。

操作灵活性与兼容限制

用户可通过高级安全设置自主开启或关闭此功能。即使全局启用锁定模式,也可在单次对话中临时关闭以恢复功能。然而,该模式与开发者模式存在互斥关系,二者不可共存,启用其一将自动停用另一项功能。

强化对抗提示词注入攻击的安全架构

提示词注入已成为当前大模型面临的核心安全挑战之一。攻击者常将隐藏指令嵌入文档、网页或其他可被模型解析的内容中,试图诱导系统泄露机密信息或执行非授权操作。为此,OpenAI已建立包含沙盒环境、URL过滤、行为监控与审计追踪在内的多层防御体系。锁定模式作为新增防护层级,重点聚焦于阻断已被窃取数据的外传路径。据2025年12月技术博客披露,在三个月内各类模型版本的攻防测试得分率已从27%大幅提升至76%。

不影响的基础功能清单

锁定模式不会更改记忆设定、文件上传权限、对话分享选项或对话是否用于模型训练的配置。这些功能依旧由独立开关控制。此外,该机制对Codex系统无任何影响。

第三方应用接入的风险分级管理

OpenAI将第三方集成按风险等级划分为三类:第一类为高危不可信应用,其写入操作具有显著数据泄露隐患;第二类为内部数据已存储于平台的同步连接器,虽风险较低但仍可能成为攻击者获取敏感信息的间接入口。