摘要:2026年6月23日,OpenAI正式发布GPT-5.5-Cyber满血版,在CyberGym网络安全基准测试中以85.6%的成绩登顶单模型榜首,超越Claude Mythos 5和Claude Opus 4.7。与此同时,Codex Security插件正式上线,Patch the Planet计划启动。这标志着AI编程从”写代码”进入”审代码、修代码”的新阶段。本文将深入解读GPT-5.5-Cyber的核心能力、Codex Security的实战数据、Patch the Planet计划的战略意义,以及AI网络安全时代的机遇与风险。
在AISI设计的”The Last Ones”测试中——一个32步的模拟企业网络攻击任务,覆盖4个子网、约20台主机,攻击链包括侦察、凭据窃取、横向移动、跨Active Directory forest扩展、CI/CD供应链跳转以及最终数据外泄——GPT-5.5-Cyber在10次尝试中成功完成4次,平均完成时间约6.5小时。人类专家完成这一任务大约需要20小时。