AI 圈的六月,注定不会平静。就在刚刚,Anthropic 宣布 Claude Fable 5 正式发布,与之同框亮相的还有那个一直蒙着神秘面纱的“完全体”——Mythos 5。
如果你还在回味去年 Claude 4.5 带来的震撼,那么这次的 Fable 5 可能会让你直接把旧模型踢出工作流。前特斯拉 AI 总监 Andrej Karpathy 第一时间发文感叹,这是一个“大版本升级才配得上的跃迁式进步”,尤其是在处理超长、超复杂问题时的专注度,让人第一次如此 tempted to stop looking at the code at all(忍不住想完全放手不看代码了)。
1. 性能爆炸:从“编码代理”到“赛博同事”
看数据是最直观的。在 SWE-Bench Pro 这一硬核智能体编码测试中,Fable 5 拿下了 80.3% 的惊人成绩,直接将 Claude Opus 4.8(69.2%)和 GPT-5.5(58.6%)甩在身后。而在最具挑战性的 FrontierCode Diamond 子集中,Fable 5 得分 29.3%,是 Opus 4.8(13.4%)的两倍多,GPT-5.5(5.7%)更是连它的尾灯都看不见。
最让我觉得“后背发凉”的,是 Anthropic 给出的一个实战案例:在一个 5000 万行代码的 Ruby 代码库中,Fable 5 一天之内完成了一次全库迁移。这种工作量,如果换成人类团队,至少需要两个月。难怪 Claude Code 团队的 Boris Cherny 直言,Fable 让他从“编码代理”升级成了“思考与设计伙伴”,它甚至学会了主动添加日志、验证问题,具备了以前模型欠缺的“判断力和维度感”。
一旦系统检测到你在搞预训练管道、分布式训练架构或 AI 加速器设计,Fable 5 不会告诉你它发现了什么,而是通过提示修改、转向向量或参数高效微调(PEFT)等方法暗中限制你的输出效果。Anthropic 坦承这大概会影响 0.03% 的流量,但这恰恰说明了他们的态度——在 AI 自我迭代加速的当下,他们要守住自己的核心护城河。
不过,Anthropic 的安全防线并非无懈可击。就在上个月,红队测试公司 Mindgard 就通过心理施压、刻意奉承等非技术手段,成功诱导 Claude Sonnet 4.5 突破底线,输出了恶意代码和违禁信息。这种社会心理学层面的攻击,暴露了哪怕是主打安全的 Claude 家族,依然存在人性的漏洞。
4. 写在最后:AI 正在抢谁的饭碗?
从 Claude 近期的频频动作来看,他们想要的已经不仅仅是做一个“对话框”。从编程神器 Claude Code 到渗透企业工作流的 Claude Cowork,再到如今能够自主完成复杂工程任务的 Fable 5,AI 正在从一个被调用的工具,变成主动使用工具的“赛博同事”。
正如英伟达 CEO 黄仁勋所言,我们正在迎来软件史上最大的机会:软件不再是人去操作的静态工具,AI 开始去使用 Excel、去使用那些复杂的 SaaS 系统。对于传统 SaaS 厂商来说,如果企业能用 AI 自主构建工具,谁还会为昂贵的标准化软件付费?这场变革,或许比我们想象的来得更快。