摘要:2026年6月23日,OpenAI推出升级版GPT-5.5-Cyber安全专用模型,在CyberGym基准评估中以85.6%的得分超越Anthropic Claude Mythos 5的83.8%,登顶单模型最高分。与此同时,OpenAI将Codex Security扫描器以应用插件形式正式发布,联合30家全球安全厂商启动”Patch the Planet“(修补地球)开源安全计划,全面升级Daybreak网络安全平台。这是继5月7日首次推出GPT-5.5-Cyber预览版后,OpenAI在网络安全赛道的又一次重磅出击,也标志着AI驱动型安全防御体系正从”发现漏洞”向”解决安全问题”跃迁。
英国AI安全研究所(AISI)此前发布的独立评估也显示,GPT-5.5在专家级网络安全任务上的平均通过率达到71.4%,略高于Mythos Preview的68.6%。在AISI最高难度的32步企业网络攻击模拟”The Last Ones”中,GPT-5.5在10次尝试中成功完成2次(Claude Mythos为3次),成为第二个能端到端完成该模拟的模型——此前没有任何AI模型能做到。
为此,OpenAI联合知名安全研究机构Trail of Bits,并与漏洞管理平台HackerOne、Calif合作,发起”Patch the Planet”项目。该项目已开始为开源维护者提供免费安全咨询服务,不仅帮助发现和修补漏洞,还支持加固代码库、将AI安全工具融入开发流程。
Trail of Bits首席执行官Dan Guido表示:”Patch the Planet是一项互联网规模的努力,旨在帮助开源软件走在AI漏洞挖掘工具前面,同时让开源社区看到AI编程工具的收益,而非只有弊端。”
目前已有超过30个开源项目参与该计划,包括cURL、Go、Python、Sigstore和pyca/cryptography等。Trail of Bits近期组织了一场为期五天的启动冲刺,派出约25名工程师(占其员工总数的五分之一)与多位维护者协作,项目首周已发现数百个漏洞并生成数十个补丁。参与者还将获得六个月免费ChatGPT Pro和六个月Codex Security使用权。
三、三层访问机制:能力与安全的精密平衡
GPT-5.5-Cyber并非全新基础模型,而是GPT-5.5的增强版本,通过放宽部分安全拒绝边界,允许在授权场景下执行更具进攻性的网络安全任务。OpenAI设计的”网络安全受信访问计划”(Trusted Access for Cyber,简称TAC)是一个基于身份与信任机制的框架,分为三层:
Anthropic的路径:紧控。 Claude Mythos通过Project Glasswing项目分发,初始仅向约40-50家合作伙伴开放,包括美国政府以及Microsoft、Apple、Google、Cloudflare等公司。Anthropic明确表示不会向公众发布Mythos级别的模型。2026年6月初,Anthropic因特朗普政府对AI网络安全能力的担忧,被迫将新发布的Fable 5和Mythos 5模型下架。
OpenAI的路径:分层透明。 Trusted Access for Cyber项目采用多层级架构——面向普通TAC成员的较少限制版本,以及面向”负责保护关键基础设施”的最高层级审查防御者的完整GPT-5.5-Cyber。OpenAI将受信访问扩展到比Anthropic初始约40家组织规模大得多的验证防御者群体。熟悉该模型的消息人士透露,GPT-5.5-Cyber的能力”大致与Mythos相当”。