摘要:2026年6月27日,OpenAI正式发布GPT-5.6系列(Sol/Terra/Luna),性能全面碾压前代,但因美国政府要求仅向约20家“可信合作伙伴”开放;与此同时,Anthropic的Fable 5在被迫下架半个月后获准灰度回归,却仍对外籍用户设限。两大事件密集发生,标志着美国政府对前沿AI模型的监管已从“行业自律”彻底转向“国家主导”,出口管制、客户审批、分级放行成为新常态。本文深度复盘事件全貌,解读监管逻辑,并质疑巨头们的安全叙事。
OpenAI今天凌晨发布的GPT-5.6系列采用了全新命名体系——Sol(太阳)、Terra(地球)、Luna(月亮),数字管代际、名字管档位。 旗舰款GPT-5.6 Sol在Terminal-Bench 2.1测试中标准模式得分88.8%,Ultra模式更高达91.9%,超越Anthropic的Mythos 5(88.0%);在网络安全测试ExploitBench中,Sol仅用竞品三分之一的输出token就达到同等效果。 均衡款Terra性能持平前代GPT-5.5但价格减半,轻量款Luna则主打极致性价比。
API定价上,Sol输入/输出为每百万token $5/$30,与GPT-5.5标准版同价但性能大增;Terra为$2.5/$15,仅为GPT-5.5的一半;Luna仅$1/$6。 技术上新增Max模式(深度推理)和Ultra模式(多子智能体协同),上下文窗口扩展至150万tokens。
然而,这些亮点在“可用性”面前黯然失色——GPT-5.6系列目前仅面向约20家经美国政府审批的“可信合作伙伴”开放,部分客户甚至需要白宫逐一批准方可接入。 普通ChatGPT用户无论是通过API还是Codex均无法使用。 OpenAI在官方公告中罕见地表达了不满:“这种政府介入的访问流程不应成为长期默认模式……它阻碍了真正需要这些工具的用户、开发者和企业获取资源。” 但为了推进后续全面发布,OpenAI只得接受这一过渡安排,计划“数周内”逐步放开。
如果说OpenAI受的只是“限行”之苦,那Anthropic则是被直接“扣车”。6月9日,Anthropic高调发布Claude Fable 5和Mythos 5,号称史上最强网络安全模型。 然而仅3天后(6月12日),美国商务部突然下达出口管制指令,禁止任何外籍国民访问这两款模型——连Anthropic自己的外籍员工也不例外,导致全球紧急下架。
Anthropic在官方声明中委屈地表示,政府认定的“越狱漏洞”其实仅能发现“少数已知的、轻微的漏洞”,且其他公开模型同样能被攻破。声明强调Fable经过了数千小时的红队测试,其安全措施“远超此前任何已部署模型”。 但国家安全面前,技术辩解显得苍白无力。
经过半个月的密集游说——特别是联合创始人Tom Brown接手谈判后,情况出现转机。 6月27日,美国政府批准Mythos 5向约100家美国关键基础设施机构和企业重新部署,Fable 5的公众版也“恢复在即”。 但这并非真正的“复活”:外籍人士依然被禁止访问,且使用范围严格限定在“白名单”机构内。 正如市场分析指出的,这不是简单的监管延迟,而是政府对模型分发渠道的“精准切割”——谁可以用、用在哪儿、谁能看,均由华盛顿决定。
这两起事件串起了美国政府的前沿AI管控新逻辑。时间线清晰显示了从行政令到出口管制的完整闭环:
不到一个月,美国完成了“叫停—谈判—有条件放行”的完整治理周期。 背后是CAISI(美国AI标准与创新中心) 的快速成形——Anthropic、OpenAI、Google、xAI等已签署协议,允许政府在模型公开前进行国家安全相关测试,这些评估虽名义上“自愿”,但已成为模型上市前的强制性门槛。
前白宫AI顾问、现任OpenAI战略负责人Dean Ball在博客中坦言:“没有人知道获得许可的要求到底是什么——连政府部门自己都不知道。” 这种不确定性恰恰是监管威慑力的一部分:厂商无法预判红线,只能更加保守。行业分析人士指出,硅谷大模型“自由发布”的时代已正式终结,取而代之的是“分级强监管周期”。
在政府监管收紧的同时,巨头们自家的安全叙事也出现了裂痕。
OpenAI一方面宣称GPT-5.6 Sol“更擅长帮助防御者补洞而非攻击者破门”,投入了超过70万A100等效GPU小时进行红队测试。 但就在过去一个月内,其Codex开发工具和账户体系连续被曝出现低级安全失误——token泄露、权限越权等问题令人担忧:为何最强网络安全模型没能提前审查自家基础设施?是技术盲区还是宣传远超实际?这恐怕不是一次“草台班子”就能解释的。
而Anthropic这边,故事更具戏剧性。据媒体披露,就在Mythos 5被吹成“有史以来最强大的网络安全模型”的两个月间,有机构利用近2.5万个虚假账号与Claude交互超过2880万次,成功蒸馏了模型能力。一个“最安全”的模型,为何对大规模、持续数月的数据窃取毫无察觉?是被高估了,还是安全承诺本来就是营销话术?这种强烈的反差,让Anthropic政府谈判时那句“怪胎”(weirdo)的评价显得格外讽刺。
GPT-5.6“宣而不发”与Fable 5“归来再限”共同宣告:前沿大模型的研发与发布已不再是企业能独立决定的事。出口管制、国籍限制、客户审查、分阶段放行——这些原本属于军工领域的管控手段,正在系统性地移植到AI领域。
对于全球开发者和企业而言,未来获取最强AI模型的门槛将持续抬高:商用API接入需要前置审批,海外企业采购面临更复杂的合规审查,模型能力越强、监管约束越硬。 正如OpenAI自己所担心的,政府审批若成为长期默认做法,只会让先进工具远离真正需要的人。但在国家安全叙事的裹挟下,这种趋势似乎已难以逆转。
合规能力、本地化部署、稳定服务,正在成为与模型性能同等重要的选型指标。 美国主导的这场“AI治理实验”,不仅改写了硅谷的游戏规则,也将深刻重塑全球AI竞争格局。
文章来源:本文综合参考了腾讯新闻、BlockBeats、36氪、今日头条、新浪财经、CSDN、ExplainX、Anthropic官方声明等多个来源,具体引用见文中编号标注。