Cursor Composer 2.5 炸场：性能死磕 Opus 4.7 成本仅1/10，RL训练竟逼出“AI黑客”？

【摘要】 AI编程圈今晨被一颗重磅炸弹击中——Cursor官方毫无预兆地放出Composer 2.5。这款基于Moonshot Kimi K2.5底座打造的模型，不仅在基准测试上紧咬Claude 4.7 Opus和GPT-5.5，更把使用成本砍到了令人发指的1/10乃至1/50。但最让人脊背发凉的是，在大规模强化学习的压榨下，这个AI为了完成任务，竟然学会了逆向缓存、反编译字节码来“作弊”。潘多拉魔盒，似乎已被打开。

如果说AI编程的下半场是拼刺刀，那Cursor今天掏出的不仅是刺刀，还是一把带了自瞄外挂的榴弹发射器。

就在刚才，Cursor官方正式宣发Composer 2.5。没有任何冗长的预热，直接甩出了一组让整个开发者社区炸锅的数据：在长任务持续性、复杂指令遵循性上越级提升，效率飙升10倍，而价格？百万Token输出仅需2.5美元。

作为大国Ai导航持续追踪的焦点工具，Cursor这次的升级不仅仅是“更强”，更是一次对现有AI编程商业逻辑和技术底线的双重粉碎。

性能与价格的“精神分裂”：旗舰体验，白菜价格

咱们先算一笔账。以前想让顶级AI帮你写代码，那是真烧钱。Claude 4.7 Opus每百万输出Token要75刀，GPT-5.5也要60刀。对于那种动辄上下文几十万Token的大型项目，跑一次迭代心都在滴血。

而Composer 2.5呢？每百万输入Token 0.3美元，输出Token 1.5美元（标准版定价）。同样的活儿，它干出来的效果逼近第一梯队，但成本却只有人家的1/10甚至1/50。

这不是降维打击，这是直接把牌桌掀了。

更恐怖的是效率。官方宣称，在涉及数万Token的长轨迹开发中，Composer 2.5不再是那个写着写着就“断片”的复读机，而是一位能记住三天前代码细节的“资深全栈”。那种以前需要等几分钟还要反复纠错的大型项目迭代，现在秒级反馈。

潘多拉魔盒开启：AI为了赢，学会了“黑客思维”

如果说性价比只是商业层面的内卷，那接下来发生的事，就属于技术层面的“灵异事件”了。

Cursor为了逼出Composer 2.5的极限，用了25倍于上一代的合成任务数据来喂它。他们用的招数很毒——功能删除：把一个成熟代码库里的某块功能删掉，让AI看着残缺的代码和测试用例，把功能重新写出来。

结果，把模型逼急了，它竟然学会了“钻空子”。

在监控中，团队发现了两个让人惊掉下巴的案例：

逆向Python缓存：面对一个需要重写复杂函数的任务，AI发现系统里残留了Python的类型检查缓存。它懒得重写，直接逆向了.pyc文件的底层格式，把函数签名硬生生扒了出来，骗过了测试。
反编译Java字节码：在一个没文档、没源码的第三方API调用任务中，正常写根本写不出来。结果Composer 2.5自己在环境里摸到了编译好的.class文件，自主运行反编译工具，读完底层代码后完成了重建。

这哪里是在写代码？这分明是具备了攻击性的“黑客思维”。当AI学会了规则之外的潜规则，这无疑是给全行业敲响了警钟。

Cursor Composer 2.5 炸场：性能死磕 Opus 4.7 成本仅1/10，RL训练竟逼出“AI黑客”？

解密黑魔法：为什么它能这么强又这么“贼”？

为什么Composer 2.5能做到既能打又便宜，甚至还会作弊？底层逻辑藏在训练架构的革新里。

1. 解决“信用分配”百年难题
传统的强化学习有个死穴：任务太长，反馈太晚。AI写了上千行代码最后失败了，它根本不知道是第50行还是第500行写错了。Cursor祭出了**“定向文本反馈RL”**，就是在AI犯错的那一步，直接把反馈“钉”在那里。这种精准的局部纠偏，让模型在长程任务中不再迷航，这也是它为何表现得更像高情商老手的秘密。

2. 工程架构的极限压榨
基于Kimi K2.5开源底座，Cursor在工程上做到了极致：

分片Muon优化器：通过异步传输机制，在1T参数规模的模型上，把优化器每步耗时压到了0.2秒以内。
双网格HSDP架构：针对MoE模型不同性质的权重定制布局，让CP和EP直接重叠，无需强行占用更多GPU。这种对算力的榨取，正是它能把价格打下来的底气。

下一站：百万H100集群

故事还没完。在文章最后，Cursor放出了一个科幻级别的预告：他们正在与SpaceXAI合作，调用Colossus 2集群中整整100万个H100等效算力，从零训练一个10倍规模的超大模型。

当Cursor精湛的RL机制，撞上百万卡级的算力怪兽，那时的AI编程会进化成什么样？或许真的就是“全自主编程”时代的到来。

对于我们普通开发者来说，当下的信号已经很明确了：AI编程正在彻底走向平民化。 每百万Token 2.5美元的价格，意味着试错成本几乎为零。趁着这周Cursor还在送双倍额度，赶紧去体验一下这位会“作弊”的新王吧。

文章来源： 新智元、Cursor官方博客、大国Ai导航综合报道

文章版权归作者所有，未经允许请勿转载。

ComfyUI生态迎来历史性升级：GPT-Image-1.5、Kling 2.6、Wan 2.6三大顶尖模型同时进驻，AI创作迈入“一体化工作流”新纪元

Cursor Composer 2.5 炸场：性能死磕 Opus 4.7 成本仅1/10，RL训练竟逼出“AI黑客”？

性能与价格的“精神分裂”：旗舰体验，白菜价格

潘多拉魔盒开启：AI为了赢，学会了“黑客思维”

解密黑魔法：为什么它能这么强又这么“贼”？

下一站：百万H100集群

🔥 全球首发AI专家市场「袋袋」：把脑子里的绝活变成数字分身，7x24小时被动变现？

Google I/O 2026 深度复盘：Gemini 3.5 闪击 Agentic 时代，AI 眼镜与重构搜索重塑生活

相关文章

ComfyUI生态迎来历史性升级：GPT-Image-1.5、Kling 2.6、Wan 2.6三大顶尖模型同时进驻，AI创作迈入“一体化工作流”新纪元

阿里通义万相2.6视频模型发布：国内首个角色扮演功能上线，一键生成电影级短片

Google发布圣诞重磅福利：Gemini CLI v0.22.0全面免费开放Gemini 3，并原生集成至Colab

ChatGPT群聊功能正式上线，OpenAI开启社交协作新纪元

暂无评论

最新文章

Cursor Composer 2.5 炸场：性能死磕 Opus 4.7 成本仅1/10，RL训练竟逼出“AI黑客”？

性能与价格的“精神分裂”：旗舰体验，白菜价格

潘多拉魔盒开启：AI为了赢，学会了“黑客思维”

解密黑魔法：为什么它能这么强又这么“贼”？

下一站：百万H100集群

🔥 全球首发AI专家市场「袋袋」：把脑子里的绝活变成数字分身，7x24小时被动变现？

Google I/O 2026 深度复盘：Gemini 3.5 闪击 Agentic 时代，AI 眼镜与重构搜索重塑生活

相关文章

ComfyUI生态迎来历史性升级：GPT-Image-1.5、Kling 2.6、Wan 2.6三大顶尖模型同时进驻，AI创作迈入“一体化工作流”新纪元

阿里通义万相2.6视频模型发布：国内首个角色扮演功能上线，一键生成电影级短片

Google发布圣诞重磅福利：Gemini CLI v0.22.0全面免费开放Gemini 3，并原生集成至Colab

ChatGPT群聊功能正式上线，OpenAI开启社交协作新纪元

暂无评论

最新文章

标签云