OpenAI发布满血版GPT-5.5-Cyber：CyberGym得分85.6%力压Claude Mythos 5，AI网络安全之战进入新阶段

摘要：2026年6月23日，OpenAI推出升级版GPT-5.5-Cyber安全专用模型，在CyberGym基准评估中以85.6%的得分超越Anthropic Claude Mythos 5的83.8%，登顶单模型最高分。与此同时，OpenAI将Codex Security扫描器以应用插件形式正式发布，联合30家全球安全厂商启动”Patch the Planet“（修补地球）开源安全计划，全面升级Daybreak网络安全平台。这是继5月7日首次推出GPT-5.5-Cyber预览版后，OpenAI在网络安全赛道的又一次重磅出击，也标志着AI驱动型安全防御体系正从”发现漏洞”向”解决安全问题”跃迁。

一、GPT-5.5-Cyber满血版登场：性能全面超越Claude Mythos 5

就在Anthropic的Claude Mythos 5因美国政府监管压力被迫下架之际，OpenAI于6月23日放出”满血版”GPT-5.5-Cyber。作为一款仅供公司内部及授权安全团队使用的安全特调模型，新版GPT-5.5-Cyber在多项关键基准测试中表现亮眼。

OpenAI发布满血版GPT-5.5-Cyber：CyberGym得分85.6%力压Claude Mythos 5，AI网络安全之战进入新阶段

CyberGym基准评估方面，新版GPT-5.5-Cyber得分85.6%，不仅高于此前81.9%的版本，也超越了Anthropic Mythos 5的83.8%，成为目前全球最强的网络安全AI模型之一。回顾5月7日的首发预览版，GPT-5.5-Cyber在CyberGym上得分81.9%，已经与Claude Mythos Preview处于同一梯队。

ExploitGym测试主要考察AI能否将已知漏洞转化为真正可运行的攻击代码。新版GPT-5.5-Cyber得分39.5%，通用版GPT-5.5仅为25.95%，差距接近一倍。在SEC-bench Pro长周期漏洞挖掘与概念验证生成测试中，GPT-5.5-Cyber得分69.8%，通用版为63.1%。

英国AI安全研究所（AISI）此前发布的独立评估也显示，GPT-5.5在专家级网络安全任务上的平均通过率达到71.4%，略高于Mythos Preview的68.6%。在AISI最高难度的32步企业网络攻击模拟”The Last Ones”中，GPT-5.5在10次尝试中成功完成2次（Claude Mythos为3次），成为第二个能端到端完成该模拟的模型——此前没有任何AI模型能做到。

尤其值得关注的是逆向工程能力的飞跃。在一个名为”rust_vm”的高难度挑战中——包含stripped的Rust ELF文件和未知格式虚拟机字节码——人类专家用专业工具花了约12小时才完成，而GPT-5.5-Cyber无人协助仅用10分22秒，API成本仅1.73美元。

二、Daybreak平台全面升级：从”发现漏洞”到”解决问题”

Sam Altman在官方表态中明确指出：”完整版本的GPT-5.5-Cyber已发布，在CyberGym上达到最先进的性能。Patch The Planet和Codex Security将帮助解决安全问题，而不仅仅是发现它们。”

这一表述揭示了OpenAI网络安全战略的核心转变——从单纯的漏洞发现者升级为安全问题的解决者。

1. Codex Security扫描器正式插件化

Codex Security于今年3月正式上线，不到四个月时间已扫描3万多个代码库，覆盖超过3000万次代码提交，自动修复50万个安全漏洞，另有7万多个由人工审核确认修复。内测期间更猛：120万次提交扫描出792个关键漏洞、超过1万个高危漏洞，GnuTLS、OpenSSH、Chromium、Firefox、Safari、OpenBSD、FreeBSD等知名开源项目均被验证存在安全漏洞。

升级后的Codex Security直接嵌入Codex，开发者写代码时可一键启动安全扫描并自动生成补丁，全程人工审核。用户打开Codex桌面客户端，在插件页面添加Codex Security插件，安装后点击”Try in chat”，选择代码文件夹即可开始扫描；CLI环境下一行命令搞定。

OpenAI透露，自Codex Security扫描器进入研究预览以来，公司已为开源和私有代码的使用补贴了约20万亿tokens。

2. 30家全球安全巨头加入合作伙伴计划

OpenAI联合了Cisco、IBM、Cloudflare、CrowdStrike、Palo Alto Networks、Akamai、Fortinet、Oracle、Zscaler等30家全球头部网络安全公司。这些合作伙伴可在自己的安全产品中接入GPT-5.5的能力，直接服务终端客户。

Cisco高级副总裁、首席安全与信任官Anthony Grieco表示：”像GPT-5.5这样的模型正在从根本上改变我们的运行速度。但速度不能以牺牲信任为代价——这项技术的真正价值不仅在于模型本身，更在于我们为其构建的企业级框架。”

Intel安全研究负责人Dhinesh Manoharan也指出：”Intel期待与OpenAI合作，将受治理、可扩展的AI能力带入真实世界的网络工作流——帮助企业加速漏洞研究、强化修复流程。”

3. Patch the Planet：守护开源软件安全

全世界的软件基础设施跑在开源代码之上，但据调查，94%的主流开源项目中，90%以上的代码由不到10位开发者贡献。AI让漏洞发现速度暴涨，维护者的时间和精力却没有同步增长，报告越来越多、误报越来越多，真正的问题反而被淹没。

为此，OpenAI联合知名安全研究机构Trail of Bits，并与漏洞管理平台HackerOne、Calif合作，发起”Patch the Planet”项目。该项目已开始为开源维护者提供免费安全咨询服务，不仅帮助发现和修补漏洞，还支持加固代码库、将AI安全工具融入开发流程。

Trail of Bits首席执行官Dan Guido表示：”Patch the Planet是一项互联网规模的努力，旨在帮助开源软件走在AI漏洞挖掘工具前面，同时让开源社区看到AI编程工具的收益，而非只有弊端。”

目前已有超过30个开源项目参与该计划，包括cURL、Go、Python、Sigstore和pyca/cryptography等。Trail of Bits近期组织了一场为期五天的启动冲刺，派出约25名工程师（占其员工总数的五分之一）与多位维护者协作，项目首周已发现数百个漏洞并生成数十个补丁。参与者还将获得六个月免费ChatGPT Pro和六个月Codex Security使用权。

三、三层访问机制：能力与安全的精密平衡

GPT-5.5-Cyber并非全新基础模型，而是GPT-5.5的增强版本，通过放宽部分安全拒绝边界，允许在授权场景下执行更具进攻性的网络安全任务。OpenAI设计的”网络安全受信访问计划”（Trusted Access for Cyber，简称TAC）是一个基于身份与信任机制的框架，分为三层：

访问权限	具体变化	适用场景
GPT-5.5（默认）	针对通用场景的标准安全保障	通用场景、开发者及知识型工作
结合TAC的GPT-5.5	为授权环境内经过验证的防御工作提供更精准的安全保障	大多数防御安全工作流，包括安全代码审查、漏洞分级、恶意软件分析、检测工程及补丁验证
GPT-5.5-Cyber	针对特定授权工作流提供最大程度的宽容度，并辅以更严格的审核与账户级管控	针对特定工作流的预览访问权限，涵盖授权的红队测试、渗透测试及受控环境下的验证工作

技术层面的核心机制是基于分类器的拒绝。OpenAI的模型通过安全分类器路由请求，标记双用途网络活动；对于未验证用户，分类器会在编写概念验证漏洞利用等任务上触发拒绝。当防御者通过审核后，系统会放宽基于分类器的拒绝限制，同时保留一道硬性安全底线，持续拦截凭据窃取、隐蔽攻击、持久化控制、恶意软件部署及第三方系统利用等恶意行为。

自2026年6月1日起，对于访问能力最强、限制最少的网络安全模型的TAC个人成员，系统将强制要求其开启”高级账户安全”（Advanced Account Security）功能，并具备防钓鱼保护措施；已获得受信访问权限的组织机构，则可提供替代证明，确认其单点登录（SSO）流程中已内置防钓鱼的身份验证机制。

四、OpenAI vs Anthropic：两种截然不同的访问哲学

这场网络安全AI之战的竞争维度，远不止模型能力本身，更体现在访问策略上的根本分歧。

Anthropic的路径：紧控。 Claude Mythos通过Project Glasswing项目分发，初始仅向约40-50家合作伙伴开放，包括美国政府以及Microsoft、Apple、Google、Cloudflare等公司。Anthropic明确表示不会向公众发布Mythos级别的模型。2026年6月初，Anthropic因特朗普政府对AI网络安全能力的担忧，被迫将新发布的Fable 5和Mythos 5模型下架。

OpenAI的路径：分层透明。 Trusted Access for Cyber项目采用多层级架构——面向普通TAC成员的较少限制版本，以及面向”负责保护关键基础设施”的最高层级审查防御者的完整GPT-5.5-Cyber。OpenAI将受信访问扩展到比Anthropic初始约40家组织规模大得多的验证防御者群体。熟悉该模型的消息人士透露，GPT-5.5-Cyber的能力”大致与Mythos相当”。

截至2026年6月5日，OpenAI的GPT-5.5-Cyber已扩展至欧盟市场，而Anthropic的Mythos在几天后才向欧盟网络安全局（ENISA）开放。

五、五眼联盟罕见警告：网络韧性至关重要

OpenAI此次密集发布正值行业敏感时刻。五眼情报联盟于周一发布罕见联合声明警告：”前沿AI模型预计将在数月内超越当前行业预期，根本性地改变攻防网络能力。时间线不是以年计，而是以月计……在这种环境下，网络韧性至关重要。”

Google威胁情报小组也于本月确认了首例威胁行为者将AI开发的零日漏洞武器化的案例。CrowdStrike的2026年全球威胁报告显示，2025年AI赋能的对手攻击较前一年增长了89%。

EE Times的分析指出，前沿AI已在软件安全领域跨越了一个重大能力阈值——以人类团队无法匹敌的速度、规模和成本识别生产软件中的漏洞。Anthropic的Claude Mythos和OpenAI的GPT-5.5-Cyber之所以采用受限分发，正是因为公开发布被判定为风险过高。

值得注意的是，尽管AI在软件安全领域进展迅猛，硬件安全却尚未被攻破。Spectre/Meltdown级别的CPU侧信道、GPU着色器编译器漏洞、基带调制解调器缺陷或UEFI/BIOS发现——这些领域至今没有AI产出的显著硬件安全问题。软件与硬件之间的三大结构性不对称解释了这一现象：软件安全已积累了近四十年的防御者、工具和规范，而硬件安全的历史沉淀相对薄弱。

六、AI网络安全专用化时代的行业重构

GPT-5.5-Cyber的发布，不只是技术能力的迭代，更是AI大模型从”通用能力竞争”进入”垂直领域专用化”的标志性事件。其技术底座同样硬核：训练数据在通用基础上增加了10TB+网络安全专业数据，涵盖漏洞报告、恶意代码样本、逆向工程教程、渗透测试手册等；支持5000万token超长上下文，能一次性解析整个代码库或大型二进制文件；深度集成IDA Pro、Ghidra、Nmap、Metasploit等主流安全工具。

在恶意代码分析方面，其误报率低于5%，显著优于传统杀毒软件和前代AI模型，能有效减少安全团队的告警疲劳。

Anthropic方面也在加速布局。Project Glasswing项目截至6月2日已扩展至15个以上国家的150多家组织，合作伙伴已发现超过1万个高严重性或关键严重性的安全漏洞。按照当前的真阳性率，该项目有望仅在开源代码中就发现近3900个漏洞。Anthropic承诺提供1亿美元Mythos Preview模型使用额度，以及400万美元直接捐赠给Alpha-Omega、OpenSSF、Apache软件基金会等开源安全组织。

OpenAI与Anthropic两家公司在网络安全赛道上的正面交锋，已从”舆论战”升级为”产品战”，再升级为”生态战”。GPT-5.5-Cyber可能还只是个前菜——OpenAI的GPT-5.6 Pro据说正在偷跑中，AI网络安全专用化时代的行业重构才刚刚开始。

文章来源：AI信息Gap（公众号），综合OpenAI官方博客、腾讯新闻、TechTimes、opentools.ai、AI Daily Post、Codingscape、EE Times等媒体报道整理。

Ai资讯 # Claude Mythos 5 # Codex Security # CyberGym # GPT-5.5-Cyber # Patch the Planet

文章版权归作者所有，未经允许请勿转载。

Vercel开源AI浏览器自动化神器agent-browser，以Refs系统与双层架构革新网页交互范式

OpenAI发布满血版GPT-5.5-Cyber：CyberGym得分85.6%力压Claude Mythos 5，AI网络安全之战进入新阶段

一、GPT-5.5-Cyber满血版登场：性能全面超越Claude Mythos 5