摘要:马斯克终于补齐了xAI在编程领域的短板。随着终端编程智能体Grok Build的上线,以及1.5T参数的V9基础模型完成训练,xAI正式向Claude Code和OpenAI Codex宣战。更致命的是,V9将引入Cursor的真实开发者过程数据进行补充训练。AI编程的“三国杀”即将在6月迎来最惨烈的正面交锋。
编程圈子这几天被马斯克搅动了。
一直以来,xAI的Grok在聊天和推理上猛刷存在感,但在程序员最看重的代码生成上,总差那么一口气。连老马自己都公开承认,xAI在编程场景上是落后的。
但就在这两天,牌桌上的局势变了。马斯克不再藏着掖着,直接甩出了两张王牌:一个是杀入终端的编程智能体Grok Build,另一个是刚跑完训练、参数飙升至1.5T的V9基础模型。
5月14日,xAI低调放出了Grok Build的早期Beta版,没过几天就迅速扩大到了所有SuperGrok和X Premium Plus用户。
如果你以为这只是又一个套壳的代码补全插件,那就大错特错了。Grok Build对标的是Claude Code和Codex CLI,它要做的是程序员的“外包搭档”,而不是“打字辅助”。
装好之后,在项目目录敲下一个grok,它就开始干活。你可以扔给它一个模糊的需求,比如“给这个API加上限流”,它会自己去找文件、改代码、跑测试、查报错,然后再自己把坑填上。
grok
最让我觉得有意思的是它的行事风格:先规划,后执行。
面对复杂任务,它不会上来就瞎改一气,而是先写一份计划,停下来等你确认。你可以逐条批注,甚至让它反问你。计划通过了,它才动手,而且每一处改动都有清晰的diff对比。当AI直接在你的项目里“动刀子”,这种审核关卡简直是保命符。
它还支持子智能体并行处理、MCP服务器,甚至内置了生成图片和视频的斜杠命令。看得出来,xAI这次是想一口吞下整个开发者工作流的入口。
工具再好,脑子不行也是白搭。Grok Build刚上线,就有用户一针见血:界面确实不错,但底层模型还是不够强。
老马的回应很直接——等V9。
他在X上毫不客气地把家底抖了出来:目前面向公众的v4.2,底座是V8模型,参数只有0.5T,训练数据质量、全面性和比例都存在重大缺陷。而内部刚刚跑完训练的V9,参数直接拉到了1.5T,用他的话说,两者差距是“gigantic”(巨大)的。
这次V9的升级,不只是参数量的三倍暴力美学,更是一次底层逻辑的重建:
1. 架构换血:抛弃Hopper,拥抱Blackwell V8是在Hopper芯片上训练的,而V9全面针对Blackwell架构进行了优化。这意味着V9不仅能吃下更大的参数量,还能在FP4低精度计算和大规模集群互联上释放出更强的算力。马斯克背后的底气,正是孟菲斯那个不断扩张的Colossus超级集群。
2. 数据升维:引入Cursor的过程数据 这是我觉得V9最狠的一招。马斯克明确表示,V9接下来要进行补充训练,核心就是加入Cursor的数据。
GitHub上的开源代码多得是,但那是“终态数据”——是已经被打磨好的最终产物。而AI编程真正缺的是什么?是过程数据。是你敲了一半回退的代码,是你和智能体来回拉扯的纠错过程,是你思考如何拆解任务的逻辑。这些藏在实际开发流程里的动作,才是训练编程智能体最稀缺的养料。V9将是第一个系统性在真实开发者行为上训练过的Grok模型。
虽然V9的饼画得很香,但现在撑起Grok Build的,其实是一个专门的编程模型:grok-build-0.1。
5月19日前后,这个模型进入了API早期访问。它支持256K的长上下文,被专门训练去执行“读问题-写代码-跑终端-查错-改错”的长链路循环。xAI已经让更早的grok-code-fast-1退役,全面转向这个新模型。
不过,grok-build-0.1和V9是不是同一套底座?有没有用上V9的预训练成果?xAI对此讳莫如深。这也意味着,现在的Grok Build还远没到它的完全体。
马斯克透露,加入Cursor数据补充训练、SFT(监督微调)和RL(强化学习)之后,V9大概还需要3到4周才能发布。时间线刚好卡在6月。
这几周里,对手可没睡觉。Claude Code的迭代速度堪称疯魔,两天修bug发版是常态;OpenAI的Codex在稳扎稳打;Cursor自己也在加深护城河。
参数翻3倍不等于能力翻3倍。1.5T的V9到底能不能在代码实战中掀翻Claude和GPT?Grok Build的“先规划后执行”能不能成为开发者的刚需?这些疑问,都要等6月份的代码实战来解答。
牌已经摊开了,马斯克All in了编程赛道。但牌桌上的人,没一个想走。
文章来源:新智元《马斯克甩出两张王牌,Grok Build杀入AI编程》 | 由大国Ai导航(daguoai.com)改写整理