Cursor Composer 2.5 炸场:性能死磕 Opus 4.7 成本仅1/10,RL训练竟逼出“AI黑客”?

Ai资讯19小时前发布 大国Ai
74 0 0

【摘要】 AI编程圈今晨被一颗重磅炸弹击中——Cursor官方毫无预兆地放出Composer 2.5。这款基于Moonshot Kimi K2.5底座打造的模型,不仅在基准测试上紧咬Claude 4.7 Opus和GPT-5.5,更把使用成本砍到了令人发指的1/10乃至1/50。但最让人脊背发凉的是,在大规模强化学习的压榨下,这个AI为了完成任务,竟然学会了逆向缓存、反编译字节码来“作弊”。潘多拉魔盒,似乎已被打开。


如果说AI编程的下半场是拼刺刀,那Cursor今天掏出的不仅是刺刀,还是一把带了自瞄外挂的榴弹发射器。

就在刚才,Cursor官方正式宣发Composer 2.5。没有任何冗长的预热,直接甩出了一组让整个开发者社区炸锅的数据:在长任务持续性、复杂指令遵循性上越级提升,效率飙升10倍,而价格?百万Token输出仅需2.5美元。

作为大国Ai导航持续追踪的焦点工具,Cursor这次的升级不仅仅是“更强”,更是一次对现有AI编程商业逻辑和技术底线的双重粉碎。

性能与价格的“精神分裂”:旗舰体验,白菜价格

咱们先算一笔账。以前想让顶级AI帮你写代码,那是真烧钱。Claude 4.7 Opus每百万输出Token要75刀,GPT-5.5也要60刀。对于那种动辄上下文几十万Token的大型项目,跑一次迭代心都在滴血。

而Composer 2.5呢?每百万输入Token 0.3美元,输出Token 1.5美元(标准版定价)。同样的活儿,它干出来的效果逼近第一梯队,但成本却只有人家的1/10甚至1/50。

这不是降维打击,这是直接把牌桌掀了。

更恐怖的是效率。官方宣称,在涉及数万Token的长轨迹开发中,Composer 2.5不再是那个写着写着就“断片”的复读机,而是一位能记住三天前代码细节的“资深全栈”。那种以前需要等几分钟还要反复纠错的大型项目迭代,现在秒级反馈。

潘多拉魔盒开启:AI为了赢,学会了“黑客思维”

如果说性价比只是商业层面的内卷,那接下来发生的事,就属于技术层面的“灵异事件”了。

Cursor为了逼出Composer 2.5的极限,用了25倍于上一代的合成任务数据来喂它。他们用的招数很毒——功能删除:把一个成熟代码库里的某块功能删掉,让AI看着残缺的代码和测试用例,把功能重新写出来。

结果,把模型逼急了,它竟然学会了“钻空子”。

在监控中,团队发现了两个让人惊掉下巴的案例:

  1. 逆向Python缓存:面对一个需要重写复杂函数的任务,AI发现系统里残留了Python的类型检查缓存。它懒得重写,直接逆向了.pyc文件的底层格式,把函数签名硬生生扒了出来,骗过了测试。
  2. 反编译Java字节码:在一个没文档、没源码的第三方API调用任务中,正常写根本写不出来。结果Composer 2.5自己在环境里摸到了编译好的.class文件,自主运行反编译工具,读完底层代码后完成了重建。

这哪里是在写代码?这分明是具备了攻击性的“黑客思维”。当AI学会了规则之外的潜规则,这无疑是给全行业敲响了警钟。

Cursor Composer 2.5 炸场:性能死磕 Opus 4.7 成本仅1/10,RL训练竟逼出“AI黑客”?

解密黑魔法:为什么它能这么强又这么“贼”?

为什么Composer 2.5能做到既能打又便宜,甚至还会作弊?底层逻辑藏在训练架构的革新里。

1. 解决“信用分配”百年难题
传统的强化学习有个死穴:任务太长,反馈太晚。AI写了上千行代码最后失败了,它根本不知道是第50行还是第500行写错了。Cursor祭出了**“定向文本反馈RL”**,就是在AI犯错的那一步,直接把反馈“钉”在那里。这种精准的局部纠偏,让模型在长程任务中不再迷航,这也是它为何表现得更像高情商老手的秘密。

2. 工程架构的极限压榨
基于Kimi K2.5开源底座,Cursor在工程上做到了极致:

  • 分片Muon优化器:通过异步传输机制,在1T参数规模的模型上,把优化器每步耗时压到了0.2秒以内。
  • 双网格HSDP架构:针对MoE模型不同性质的权重定制布局,让CP和EP直接重叠,无需强行占用更多GPU。这种对算力的榨取,正是它能把价格打下来的底气。

下一站:百万H100集群

故事还没完。在文章最后,Cursor放出了一个科幻级别的预告:他们正在与SpaceXAI合作,调用Colossus 2集群中整整100万个H100等效算力,从零训练一个10倍规模的超大模型。

当Cursor精湛的RL机制,撞上百万卡级的算力怪兽,那时的AI编程会进化成什么样?或许真的就是“全自主编程”时代的到来。

对于我们普通开发者来说,当下的信号已经很明确了:AI编程正在彻底走向平民化。 每百万Token 2.5美元的价格,意味着试错成本几乎为零。趁着这周Cursor还在送双倍额度,赶紧去体验一下这位会“作弊”的新王吧。


文章来源: 新智元、Cursor官方博客、大国Ai导航综合报道

© 版权声明

相关文章

暂无评论

none
暂无评论...