OpenAI Codex大更新:双击Command读屏、/goal自主编程毕业、锁屏也能远程打工

Ai资讯14小时前发布 大国Ai
41 0 0

摘要: 2026年5月22日,OpenAI为Codex推送了史上最大规模更新,五大核心能力同步上线。双击Command键即可让AI“看穿”屏幕隐藏文本的Appshots功能、/goal自主编码模式正式转正、Mac锁屏状态下AI可7×24小时远程打工、内置浏览器升级支持标注批改、ChatGPT正式杀入PowerPoint创建PPT。这些更新标志着Codex从“代码助手”彻底进化为“AI队友平台”——更让人细思极恐的是,如今50%的Codex用户已经开始用它干“非编程”的事了。


一、Appshots:双击Command,AI一键读懂“所有屏”

这次更新的“头号主角”,当属Appshots功能。

操作极其简单:连按两下Command键,当前应用窗口就像贴纸一样被“啪”地挂到Codex的对话线程里。但真正让开发者们头皮发麻的,不是截屏本身——而是Codex能把窗口中没滚动到的、隐藏在屏幕外的文本也一并读取

OpenAI Codex大更新:双击Command读屏、/goal自主编程毕业、锁屏也能远程打工

想象一下这个场景:你打开一篇超长的技术文档、一封密密麻麻的API参考页面,或者一个复杂的配置文件。按两下Command,Codex就像装了“X光”一样,连你没看完的部分,它全拿到了!

而且,点开Appshots的「浏览文本」选项,还能看到AI提出的完整文字版内容。这意味着Codex不仅能“看”到屏幕,还能“读”懂屏幕背后的一切。

OpenAI官方给出了几个典型应用场景:

  • 在浏览器中发现Bug,直接截图让Codex开始调试
  • 在设计稿里看到需要实现的界面,一键传给AI
  • 需要传输复杂界面的上下文,比手动贴图、复制文字省去无数步

更贴心的是交互细节:如果你在60秒内和某个Codex线程互动过,新的Appshot会自动追加到那个线程里,而不是开一个新对话。连续截多张Appshot,也会被塞进同一个对话,保持上下文连贯性。

目前,Appshots已在Mac所有版本计划中上线,企业级用户的专属权限也即将开放。

二、/goal正式“毕业”:设个目标,AI自己跑一天

第二个重磅更新:/goal模式正式从实验阶段转正

用法很直白:在Codex的App、IDE Extension或CLI里,给它设一个明确的里程碑目标。接下来,它就会像一个不知疲倦的劳模一样持续推进,哪怕这个任务需要几个小时甚至几天

这不再是“扔个prompt等结果”的一次性交互,而是真正的长周期自主工作。社区里已经有人让Codex连续跑了21小时,烧掉9亿token

/goal到底解决了什么痛点?

以前用AI写代码是“回合制”——你说一句,它做一步,然后停下来等你确认。面对大型重构、全量迁移、多文件修改这种需要几十步才能完成的任务,人就成了AI的“人工鼠标”。

/goal的核心思路很简单:你只需要定义“什么算做完”,AI自己决定“每一步怎么做”

值得注意的是,/goal内部有一套完整的目标生命周期管理机制

  1. 持久化:目标作为独立状态存起来,跟对话历史是两回事。/compact压缩对话不会破坏目标,关掉终端,下次resume还能续上
  2. 运行时延续:每一轮空闲后,Codex自动注入提示词,让模型决定下一步,不需要你手动催
  3. 完成审计:模型想标记“完成”,必须先跑一遍审计——把目标映射成清单,逐条检查证据,不能靠“测试跑过了”就算完

OpenAI总裁Greg Brockman在X上评价:“codex now has a built in Ralph loop++”。

什么时候该用/goal?

适合的场景:批量修Bug、批量生成测试、按规格文档实现完整功能、代码考古出报告、长程重构。不适合的场景:单轮就能完成的小任务、说不清“完成长什么样”的探索、需要你不断拍板的决策、破坏性操作。

三、锁屏也能干活:Codex远程操控Mac

最让开发者们激动(或者说细思极恐)的更新是:Mac不需要解锁,Codex也能用电脑

从手机端,Codex可以安全地操作Mac上的应用,哪怕屏幕关了、电脑锁了。只需在「计算机使用」设置中,开启**「Locked Use」**功能即可。

OpenAI Codex的核心开发者将其称之为“Codex的黑魔法”。

配合上周刚上线的Codex移动端预览——Codex已正式进驻ChatGPT手机App,用户可以从手机端启动新任务、检视所有进行中的对话、批准代理执行命令、切换模型、补充上下文——OpenAI正在把Codex打造成一个7×24小时不下线的远程AI员工

对于开发者来说,这意味着什么?你可以:

  • 下班后让Codex继续跑批量任务
  • 通勤时用手机审批AI提交的代码变更
  • 开会时Codex在后台自动处理CI/CD流水线

有开发者辣评:“这是逼着我现在就去买一台Mac!”

代码的执行环境始终保持在Mac本地,手机端只负责指挥和审核——文件、凭证、权限都留在执行端的机器上,仅同步状态与更新到手机端,安全性有保障。

四、内置浏览器升级:标注批改,指哪儿打哪儿

Codex的内置浏览器也得到了大幅提升。

高级标注模式支持直接在网页/UI上修改元素并实时预览,Codex自动生成对应代码。更实用的是,你可以把零散的修改意见打包成批量评论发给Codex,真正做到了“指哪儿打哪儿”。

这对于网页端开发和前端调试简直是神器——开发者不再需要手动定位代码中的Bug位置,直接在浏览器界面上标注问题,Codex就能理解并修复。

此外,Codex的Chrome扩展也在同步发力。与内置浏览器的“干净环境”不同,Chrome扩展可以使用用户真实Chrome中的登录状态,对于操作Gmail、Salesforce、LinkedIn等已登录网站更为方便。

五、ChatGPT攻入PowerPoint:打工人笑了

说完了开发者的狂欢,该轮到打工人的福音了。

就在同一天,OpenAI宣布ChatGPT for PowerPoint插件正式开启全球Beta测试

一句简单的指令,就能让它:

  • 生成全新的幻灯片
  • 更新已有的页面
  • 把杂乱的素材转化为可以直接上台汇报的内容
  • 精简文字、调整层级、添加章节
  • 润色草稿

最关键的一点是:所有AI生成的幻灯片,完全可编辑

而真正让这个功能从“好用”变成“恐怖”的,是它的**“数据连接”能力**。ChatGPT for PowerPoint可以直接从Gmail、Outlook、SharePoint拉取实时数据。做季度回顾、董事会汇报或者客户简报的时候,不需要手动复制粘贴——你团队已经产出的信息,AI会自动帮你调取并整合进幻灯片里!

目前,这项功能已面向全球所有ChatGPT用户层级开放Beta测试。

六、更多细节更新:团队协作与分析全面升级

除了以上五大更新,Codex还迎来了一系列配套升级:

插件共享时代开启:Business用户可以在团队内部分发自定义插件、复用内部工具、统一管理工作区中可用的插件。

Analytics大升级:活跃用户、Credits消耗、Token用量、运行次数、用户排行榜、生成代码行数、插件使用量——多个维度全面拉开。还更新了Analytics API,让团队能更精确地掌握Codex在组织内的使用情况。

据官方数据,截至2026年5月,Codex的周活跃开发者已经突破400万。就在两周前,这个数字还是300万。今年1月到4月之间,Codex在ChatGPT Business和Enterprise中的用户数暴增了6倍。

七、50%的Codex用户不写代码了

更值得关注的数据是:50%的Codex用户,现在用它干的事已经不是写代码了

自动化流程、跨工具协作、长期任务管理、远程电脑操控——Codex正在从一个“编程助手”,蜕变为一个全栈工作平台

正如奥特曼此前宣布的:“每当Codex新增100万周活用户,就会重置一次所有用户的使用限额——每增长100万就重置,直到1000万为止。”

这不是一个编程工具的增长曲线。这是一个正在吞噬工作本身的产品的增长曲线。

八、总结

今天这波更新,拼在一起构成了一个清晰的信号:OpenAI正在为AI铺设一条从“工具”到“同事”,再到“超越人类”的完整通道。

Appshots让AI能“看”屏幕、/goal让AI能“自己干活”、锁屏操作让AI能“随时在线”、浏览器标注让AI能“指哪儿打哪儿”——这些能力的叠加,让Codex从一个“聊天式代码助手”,彻底蜕变成了一个能独立干活的AI队友平台

这条通道上的加速度,可能比所有人预想的都要快。


文章来源:新智元(2026年5月22日)
补充信息来源:OpenAI官方、IT之家、CSDN博客

© 版权声明

相关文章

暂无评论

none
暂无评论...