【导语】 2026年4月7日,人工智能公司Anthropic正式发布了其迄今为止最强大的模型Claude Mythos Preview。该模型定位在现有Opus层级之上,在代码、推理及网络安全能力上实现“阶跃式”提升。出于对潜在风险的审慎考量,Anthropic并未将其公开上市,而是将其纳入名为“Project Glasswing”的网络安全计划,仅向AWS、苹果、谷歌等12家核心合作伙伴及40余家关键基础设施组织开放,用于优先查找和修复软件漏洞。
Anthropic于2026年4月7日推出了Claude模型家族的新顶级层级——Mythos Preview。与以往发布不同,此模型未开放API或更新至其聊天应用,而是通过“Project Glasswing”计划进行有限分发。官方解释称,Mythos在网络安全方面展现出前所未有的能力,已在主流操作系统和浏览器中发现数千个此前未知的“零日漏洞”。为确保安全,在开发出更完善的安全护栏之前,该模型将仅用于授权组织的防御性安全研究。
Anthropic的Claude模型线此前分为Haiku(轻量快速)、Sonnet(平衡性能与成本)和Opus(最强公开模型)三个层级。本次发布在Opus之上新增了Mythos层级,标志着其技术能力出现了结构性跨越。此次发布紧随着全球对人工智能安全风险日益增长的关注。例如,经济合作与发展组织(OECD)于2025年发布了《AI事件报告共同框架》,旨在为全球AI事件报告建立统一标准,这反映了国际社会对AI系统潜在危害进行结构化监督的迫切需求。Anthropic此次以安全为由对顶级模型进行管控,正是这一行业趋势的具体体现。
本次发布的核心重点在于Mythos模型涌现出的超强网络安全能力及其受限的发布策略。
对用户/行业的影响
官方信息与关键信号
值得关注的后续问题
总结
Anthropic发布Claude Mythos Preview,是一次将尖端AI能力与安全治理深度绑定的战略发布。它既展示了AI在代码理解和安全审计方面即将带来的革命性变化,也以实践率先应对了“能力越强,责任越大”的治理挑战。通过Project Glasswing,Anthropic试图在提升全球数字基础设施安全水平的同时,掌控顶级AI技术的初始扩散路径,并为下一代AI产品的定价和商业模式探路。这一事件标志着AI产业的发展重点,正从单纯追求性能指标,转向性能、安全与可控性并重的新阶段。
【相关主题建议】
文章来源:本文综合整理了Anthropic官方发布的Project Glasswing页面、系统卡、红队博客,以及腾讯新闻、太平洋科技等媒体的公开报道。