OpenAI Codex升级:智能体能力全面跃迁

OpenAI推进Codex桌面版深度进化,构建一体化智能开发环境

今日,OpenAI宣布对Codex桌面应用程序实施关键性功能扩展,新增屏幕感知操作、内建浏览器、图像生成模块以及超过九十项新插件。自初版上线近一年以来,该工具已吸引每周逾三百万开发者使用。公司强调,此次迭代目标是实现对开发者日常任务的全链路覆盖。

跨应用自主执行能力正式落地,提升自动化效率

通过引入系统级交互功能,Codex现可读取用户界面、精准控制光标位置,并在任意Mac应用中完成点击与输入动作。多个智能体可并行运行,且不影响用户正在进行的其他操作。此特性尤其适用于前端快速迭代、自动化测试流程以及缺乏开放接口的复杂业务场景。

生态集成深化与多模态能力融合

内置浏览器支持在网页上直接添加注释,为智能体提供上下文明确的操作指引。现阶段主要服务于前端与游戏开发方向,后续将逐步开放完整浏览器控制权限。基于gpt-image-1.5模型的图像生成能力已无缝嵌入工作流,无需额外配置密钥,费用由ChatGPT订阅账户统一承担。

本次更新还整合了九十余个新插件,涵盖与Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、微软办公套件及Databricks Neon等平台的深度对接。借助多技能融合机制、API调用通道与MCP服务器架构,显著增强了Codex在现有开发生态中的感知力与执行精度。

工作流管理机制实现智能化跃升

新版应用支持跨设备标签页同步、自动解析GitHub代码审查评论、远程开发环境的SSH连接验证,并配备可视化摘要面板,用于追踪智能体的任务进度、资源消耗与产出结果。各类文档可在侧边栏直接打开,同时提供对PDF、电子表格及演示文件的丰富预览功能。

OpenAI表示,此次升级旨在达成“过去仅靠大量人工指令才能实现的自动化水平”。新增的主动建议模式能结合插件库、历史记忆与当前项目状态,自动生成包含谷歌文档批注、Slack对话记录、Notion页面信息及代码背景的优先级任务清单,为用户提供每日启动方案或中断任务的续接推荐。

技术演进脉络与行业格局重构

本次功能集合与2026年初引发热议的开源智能体框架OpenClaw存在高度契合点。该框架由奥地利开发者Peter Steinberger发起,支持本地部署、持久运行的智能体,具备连接通讯工具、文件系统、浏览器及终端命令的能力。其开源版本在七十二小时内获得六万星标,被业界视为个人智能操作系统的重要雏形。

随着OpenClaw快速发展,Steinberger于今年二月加入OpenAI并主导个人智能体研发项目,随后该计划转由OpenAI资助的开源基金会运营。此前,另一科技巨头曾因命名争议提出商标异议,促使团队两次更名,加速了向OpenAI生态迁移的进程。需指出的是,OpenClaw早期版本基于该企业提供的模型架构运行。

在封闭源码开发工具领域,与Codex形成直接竞争的是Anthropic推出的Claude Code。这款终端式智能编码助手可遍历整个代码库、编辑文件、执行测试并提交至GitHub。今年三月,Anthropic亦为其产品推出计算机操作功能,目前仅对macOS高级订阅用户开放研究预览。

Codex以桌面应用形式整合了计算机控制、网页浏览、图像生成与代码编写等多项能力,并与ChatGPT账户体系深度绑定。OpenAI将其定位为“致力于弥合人类构想与实际构建之间差距”的核心路径。

本次更新即日起面向所有通过ChatGPT登录的Codex用户推送。个性化功能与计算机操作能力暂未在欧盟及英国地区启用。