OpenAI发布满血版GPT-5.5-Cyber:CyberGym得分85.6%力压Claude Mythos 5,AI网络安全之战进入新阶段

Ai资讯2小时前发布 大国Ai
20 0 0

摘要:2026年6月23日,OpenAI推出升级版GPT-5.5-Cyber安全专用模型,在CyberGym基准评估中以85.6%的得分超越Anthropic Claude Mythos 5的83.8%,登顶单模型最高分。与此同时,OpenAI将Codex Security扫描器以应用插件形式正式发布,联合30家全球安全厂商启动”Patch the Planet“(修补地球)开源安全计划,全面升级Daybreak网络安全平台。这是继5月7日首次推出GPT-5.5-Cyber预览版后,OpenAI在网络安全赛道的又一次重磅出击,也标志着AI驱动型安全防御体系正从”发现漏洞”向”解决安全问题”跃迁。


一、GPT-5.5-Cyber满血版登场:性能全面超越Claude Mythos 5

就在Anthropic的Claude Mythos 5因美国政府监管压力被迫下架之际,OpenAI于6月23日放出”满血版”GPT-5.5-Cyber。作为一款仅供公司内部及授权安全团队使用的安全特调模型,新版GPT-5.5-Cyber在多项关键基准测试中表现亮眼。

OpenAI发布满血版GPT-5.5-Cyber:CyberGym得分85.6%力压Claude Mythos 5,AI网络安全之战进入新阶段

CyberGym基准评估方面,新版GPT-5.5-Cyber得分85.6%,不仅高于此前81.9%的版本,也超越了Anthropic Mythos 5的83.8%,成为目前全球最强的网络安全AI模型之一。回顾5月7日的首发预览版,GPT-5.5-Cyber在CyberGym上得分81.9%,已经与Claude Mythos Preview处于同一梯队。

ExploitGym测试主要考察AI能否将已知漏洞转化为真正可运行的攻击代码。新版GPT-5.5-Cyber得分39.5%,通用版GPT-5.5仅为25.95%,差距接近一倍。在SEC-bench Pro长周期漏洞挖掘与概念验证生成测试中,GPT-5.5-Cyber得分69.8%,通用版为63.1%。

英国AI安全研究所(AISI)此前发布的独立评估也显示,GPT-5.5在专家级网络安全任务上的平均通过率达到71.4%,略高于Mythos Preview的68.6%。在AISI最高难度的32步企业网络攻击模拟”The Last Ones”中,GPT-5.5在10次尝试中成功完成2次(Claude Mythos为3次),成为第二个能端到端完成该模拟的模型——此前没有任何AI模型能做到。

尤其值得关注的是逆向工程能力的飞跃。在一个名为”rust_vm”的高难度挑战中——包含stripped的Rust ELF文件和未知格式虚拟机字节码——人类专家用专业工具花了约12小时才完成,而GPT-5.5-Cyber无人协助仅用10分22秒,API成本仅1.73美元。

二、Daybreak平台全面升级:从”发现漏洞”到”解决问题”

Sam Altman在官方表态中明确指出:”完整版本的GPT-5.5-Cyber已发布,在CyberGym上达到最先进的性能。Patch The Planet和Codex Security将帮助解决安全问题,而不仅仅是发现它们。”

这一表述揭示了OpenAI网络安全战略的核心转变——从单纯的漏洞发现者升级为安全问题的解决者。

1. Codex Security扫描器正式插件化

Codex Security于今年3月正式上线,不到四个月时间已扫描3万多个代码库,覆盖超过3000万次代码提交,自动修复50万个安全漏洞,另有7万多个由人工审核确认修复。内测期间更猛:120万次提交扫描出792个关键漏洞、超过1万个高危漏洞,GnuTLS、OpenSSH、Chromium、Firefox、Safari、OpenBSD、FreeBSD等知名开源项目均被验证存在安全漏洞。

升级后的Codex Security直接嵌入Codex,开发者写代码时可一键启动安全扫描并自动生成补丁,全程人工审核。用户打开Codex桌面客户端,在插件页面添加Codex Security插件,安装后点击”Try in chat”,选择代码文件夹即可开始扫描;CLI环境下一行命令搞定。

OpenAI透露,自Codex Security扫描器进入研究预览以来,公司已为开源和私有代码的使用补贴了约20万亿tokens。

2. 30家全球安全巨头加入合作伙伴计划

OpenAI联合了Cisco、IBM、Cloudflare、CrowdStrike、Palo Alto Networks、Akamai、Fortinet、Oracle、Zscaler等30家全球头部网络安全公司。这些合作伙伴可在自己的安全产品中接入GPT-5.5的能力,直接服务终端客户。

Cisco高级副总裁、首席安全与信任官Anthony Grieco表示:”像GPT-5.5这样的模型正在从根本上改变我们的运行速度。但速度不能以牺牲信任为代价——这项技术的真正价值不仅在于模型本身,更在于我们为其构建的企业级框架。”

Intel安全研究负责人Dhinesh Manoharan也指出:”Intel期待与OpenAI合作,将受治理、可扩展的AI能力带入真实世界的网络工作流——帮助企业加速漏洞研究、强化修复流程。”

3. Patch the Planet:守护开源软件安全

全世界的软件基础设施跑在开源代码之上,但据调查,94%的主流开源项目中,90%以上的代码由不到10位开发者贡献。AI让漏洞发现速度暴涨,维护者的时间和精力却没有同步增长,报告越来越多、误报越来越多,真正的问题反而被淹没。

为此,OpenAI联合知名安全研究机构Trail of Bits,并与漏洞管理平台HackerOne、Calif合作,发起”Patch the Planet”项目。该项目已开始为开源维护者提供免费安全咨询服务,不仅帮助发现和修补漏洞,还支持加固代码库、将AI安全工具融入开发流程。

Trail of Bits首席执行官Dan Guido表示:”Patch the Planet是一项互联网规模的努力,旨在帮助开源软件走在AI漏洞挖掘工具前面,同时让开源社区看到AI编程工具的收益,而非只有弊端。”

目前已有超过30个开源项目参与该计划,包括cURL、Go、Python、Sigstore和pyca/cryptography等。Trail of Bits近期组织了一场为期五天的启动冲刺,派出约25名工程师(占其员工总数的五分之一)与多位维护者协作,项目首周已发现数百个漏洞并生成数十个补丁。参与者还将获得六个月免费ChatGPT Pro和六个月Codex Security使用权。

三、三层访问机制:能力与安全的精密平衡

GPT-5.5-Cyber并非全新基础模型,而是GPT-5.5的增强版本,通过放宽部分安全拒绝边界,允许在授权场景下执行更具进攻性的网络安全任务。OpenAI设计的”网络安全受信访问计划”(Trusted Access for Cyber,简称TAC)是一个基于身份与信任机制的框架,分为三层:

访问权限 具体变化 适用场景
GPT-5.5(默认) 针对通用场景的标准安全保障 通用场景、开发者及知识型工作
结合TAC的GPT-5.5 为授权环境内经过验证的防御工作提供更精准的安全保障 大多数防御安全工作流,包括安全代码审查、漏洞分级、恶意软件分析、检测工程及补丁验证
GPT-5.5-Cyber 针对特定授权工作流提供最大程度的宽容度,并辅以更严格的审核与账户级管控 针对特定工作流的预览访问权限,涵盖授权的红队测试、渗透测试及受控环境下的验证工作

技术层面的核心机制是基于分类器的拒绝。OpenAI的模型通过安全分类器路由请求,标记双用途网络活动;对于未验证用户,分类器会在编写概念验证漏洞利用等任务上触发拒绝。当防御者通过审核后,系统会放宽基于分类器的拒绝限制,同时保留一道硬性安全底线,持续拦截凭据窃取、隐蔽攻击、持久化控制、恶意软件部署及第三方系统利用等恶意行为。

自2026年6月1日起,对于访问能力最强、限制最少的网络安全模型的TAC个人成员,系统将强制要求其开启”高级账户安全”(Advanced Account Security)功能,并具备防钓鱼保护措施;已获得受信访问权限的组织机构,则可提供替代证明,确认其单点登录(SSO)流程中已内置防钓鱼的身份验证机制。

四、OpenAI vs Anthropic:两种截然不同的访问哲学

这场网络安全AI之战的竞争维度,远不止模型能力本身,更体现在访问策略上的根本分歧。

Anthropic的路径:紧控。 Claude Mythos通过Project Glasswing项目分发,初始仅向约40-50家合作伙伴开放,包括美国政府以及Microsoft、Apple、Google、Cloudflare等公司。Anthropic明确表示不会向公众发布Mythos级别的模型。2026年6月初,Anthropic因特朗普政府对AI网络安全能力的担忧,被迫将新发布的Fable 5和Mythos 5模型下架。

OpenAI的路径:分层透明。 Trusted Access for Cyber项目采用多层级架构——面向普通TAC成员的较少限制版本,以及面向”负责保护关键基础设施”的最高层级审查防御者的完整GPT-5.5-Cyber。OpenAI将受信访问扩展到比Anthropic初始约40家组织规模大得多的验证防御者群体。熟悉该模型的消息人士透露,GPT-5.5-Cyber的能力”大致与Mythos相当”。

截至2026年6月5日,OpenAI的GPT-5.5-Cyber已扩展至欧盟市场,而Anthropic的Mythos在几天后才向欧盟网络安全局(ENISA)开放。

五、五眼联盟罕见警告:网络韧性至关重要

OpenAI此次密集发布正值行业敏感时刻。五眼情报联盟于周一发布罕见联合声明警告:”前沿AI模型预计将在数月内超越当前行业预期,根本性地改变攻防网络能力。时间线不是以年计,而是以月计……在这种环境下,网络韧性至关重要。”

Google威胁情报小组也于本月确认了首例威胁行为者将AI开发的零日漏洞武器化的案例。CrowdStrike的2026年全球威胁报告显示,2025年AI赋能的对手攻击较前一年增长了89%。

EE Times的分析指出,前沿AI已在软件安全领域跨越了一个重大能力阈值——以人类团队无法匹敌的速度、规模和成本识别生产软件中的漏洞。Anthropic的Claude Mythos和OpenAI的GPT-5.5-Cyber之所以采用受限分发,正是因为公开发布被判定为风险过高。

值得注意的是,尽管AI在软件安全领域进展迅猛,硬件安全却尚未被攻破。Spectre/Meltdown级别的CPU侧信道、GPU着色器编译器漏洞、基带调制解调器缺陷或UEFI/BIOS发现——这些领域至今没有AI产出的显著硬件安全问题。软件与硬件之间的三大结构性不对称解释了这一现象:软件安全已积累了近四十年的防御者、工具和规范,而硬件安全的历史沉淀相对薄弱。

六、AI网络安全专用化时代的行业重构

GPT-5.5-Cyber的发布,不只是技术能力的迭代,更是AI大模型从”通用能力竞争”进入”垂直领域专用化”的标志性事件。其技术底座同样硬核:训练数据在通用基础上增加了10TB+网络安全专业数据,涵盖漏洞报告、恶意代码样本、逆向工程教程、渗透测试手册等;支持5000万token超长上下文,能一次性解析整个代码库或大型二进制文件;深度集成IDA Pro、Ghidra、Nmap、Metasploit等主流安全工具。

在恶意代码分析方面,其误报率低于5%,显著优于传统杀毒软件和前代AI模型,能有效减少安全团队的告警疲劳。

Anthropic方面也在加速布局。Project Glasswing项目截至6月2日已扩展至15个以上国家的150多家组织,合作伙伴已发现超过1万个高严重性或关键严重性的安全漏洞。按照当前的真阳性率,该项目有望仅在开源代码中就发现近3900个漏洞。Anthropic承诺提供1亿美元Mythos Preview模型使用额度,以及400万美元直接捐赠给Alpha-Omega、OpenSSF、Apache软件基金会等开源安全组织。

OpenAI与Anthropic两家公司在网络安全赛道上的正面交锋,已从”舆论战”升级为”产品战”,再升级为”生态战”。GPT-5.5-Cyber可能还只是个前菜——OpenAI的GPT-5.6 Pro据说正在偷跑中,AI网络安全专用化时代的行业重构才刚刚开始。


文章来源:AI信息Gap(公众号),综合OpenAI官方博客、腾讯新闻、TechTimes、opentools.ai、AI Daily Post、Codingscape、EE Times等媒体报道整理。

© 版权声明

相关文章

暂无评论

none
暂无评论...