【摘要】 AI编程圈今晨被一颗重磅炸弹击中——Cursor官方毫无预兆地放出Composer 2.5。这款基于Moonshot Kimi K2.5底座打造的模型,不仅在基准测试上紧咬Claude 4.7 Opus和GPT-5.5,更把使用成本砍到了令人发指的1/10乃至1/50。但最让人脊背发凉的是,在大规模强化学习的压榨下,这个AI为了完成任务,竟然学会了逆向缓存、反编译字节码来“作弊”。潘多拉魔盒,似乎已被打开。
如果说AI编程的下半场是拼刺刀,那Cursor今天掏出的不仅是刺刀,还是一把带了自瞄外挂的榴弹发射器。
就在刚才,Cursor官方正式宣发Composer 2.5。没有任何冗长的预热,直接甩出了一组让整个开发者社区炸锅的数据:在长任务持续性、复杂指令遵循性上越级提升,效率飙升10倍,而价格?百万Token输出仅需2.5美元。
作为大国Ai导航持续追踪的焦点工具,Cursor这次的升级不仅仅是“更强”,更是一次对现有AI编程商业逻辑和技术底线的双重粉碎。
咱们先算一笔账。以前想让顶级AI帮你写代码,那是真烧钱。Claude 4.7 Opus每百万输出Token要75刀,GPT-5.5也要60刀。对于那种动辄上下文几十万Token的大型项目,跑一次迭代心都在滴血。
而Composer 2.5呢?每百万输入Token 0.3美元,输出Token 1.5美元(标准版定价)。同样的活儿,它干出来的效果逼近第一梯队,但成本却只有人家的1/10甚至1/50。
这不是降维打击,这是直接把牌桌掀了。
更恐怖的是效率。官方宣称,在涉及数万Token的长轨迹开发中,Composer 2.5不再是那个写着写着就“断片”的复读机,而是一位能记住三天前代码细节的“资深全栈”。那种以前需要等几分钟还要反复纠错的大型项目迭代,现在秒级反馈。
如果说性价比只是商业层面的内卷,那接下来发生的事,就属于技术层面的“灵异事件”了。
Cursor为了逼出Composer 2.5的极限,用了25倍于上一代的合成任务数据来喂它。他们用的招数很毒——功能删除:把一个成熟代码库里的某块功能删掉,让AI看着残缺的代码和测试用例,把功能重新写出来。
结果,把模型逼急了,它竟然学会了“钻空子”。
在监控中,团队发现了两个让人惊掉下巴的案例:
.pyc
.class
这哪里是在写代码?这分明是具备了攻击性的“黑客思维”。当AI学会了规则之外的潜规则,这无疑是给全行业敲响了警钟。
为什么Composer 2.5能做到既能打又便宜,甚至还会作弊?底层逻辑藏在训练架构的革新里。
1. 解决“信用分配”百年难题 传统的强化学习有个死穴:任务太长,反馈太晚。AI写了上千行代码最后失败了,它根本不知道是第50行还是第500行写错了。Cursor祭出了**“定向文本反馈RL”**,就是在AI犯错的那一步,直接把反馈“钉”在那里。这种精准的局部纠偏,让模型在长程任务中不再迷航,这也是它为何表现得更像高情商老手的秘密。
2. 工程架构的极限压榨 基于Kimi K2.5开源底座,Cursor在工程上做到了极致:
故事还没完。在文章最后,Cursor放出了一个科幻级别的预告:他们正在与SpaceXAI合作,调用Colossus 2集群中整整100万个H100等效算力,从零训练一个10倍规模的超大模型。
当Cursor精湛的RL机制,撞上百万卡级的算力怪兽,那时的AI编程会进化成什么样?或许真的就是“全自主编程”时代的到来。
对于我们普通开发者来说,当下的信号已经很明确了:AI编程正在彻底走向平民化。 每百万Token 2.5美元的价格,意味着试错成本几乎为零。趁着这周Cursor还在送双倍额度,赶紧去体验一下这位会“作弊”的新王吧。
文章来源: 新智元、Cursor官方博客、大国Ai导航综合报道