Grok 4.5内部测试启动：1.5万亿参数V9模型加持，马斯克称性能逼近Opus

摘要：2026年6月28日，马斯克在X平台官宣Grok 4.5已在SpaceX与特斯拉内部启动私有测试。该模型基于1.5万亿参数V9基础大模型打造，补充训练阶段引入Cursor数据，早期评测显示性能接近甚至有望超越Anthropic的Opus模型。此外，SpaceX今年将每月推出一款从零训练的全新模型，迭代节奏堪称激进。

一、Grok 4.5核心升级：1.5T参数V9模型 + Cursor数据加持

马斯克今日在X平台发文披露了Grok 4.5的最新进展。这款新一代模型基于xAI自研的1.5万亿参数V9基础大模型打造，并在补充训练阶段加入了Cursor数据。

值得一提的是，Cursor是今年4月份SpaceX官方宣布以600亿美元收购权利的AI代码编辑器，其数据包含真实的开发者工作流（写代码、调试、迭代、修复bug等），是”人类开发者如何思考”的映射。如果Grok新模型能够有效利用这些数据，那么它将更懂真实开发者的工作方式，而非只是GitHub上的公开代码。

Grok 4.5内部测试启动：1.5万亿参数V9模型加持，马斯克称性能逼近Opus

从参数规模来看，Grok 4.5实现了显著跃升。公开资料显示，Grok 4.4参数为1万亿，而Grok 4.5升级至1.5万亿，相当于50%的参数提升。对比当前承载所有Grok生产流量的0.5T v8-small（外部测试版本Grok 4.2），新模型规模直接扩大了3倍。

二、内部测试为何选择SpaceX与特斯拉？

Grok 4.5目前已在SpaceX和特斯拉内部开启私有测试。据内部人士透露，测试范围覆盖了工程模拟、供应链优化等核心业务场景。

这一选择背后有明确的战略逻辑——两家公司均处于硬件工程、软件系统与实时决策的交汇点。SpaceX可提供火箭轨迹计算、轨道模拟等场景，特斯拉则侧重制造流程优化、电池生产线质量检测、自动驾驶数据标注等任务。

行业评论认为，这种内部测试策略赋予了xAI竞争对手难以复制的优势：访问世界级工程组织的专有运营数据。多数AI公司在公开基准测试和合成任务上验证模型，而xAI得以在真实的火箭轨迹和车辆制造流程中进行测试。

三、性能表现：接近甚至超越Opus

马斯克透露，早期评测结果显示Grok 4.5的性能接近甚至有望超越Opus模型。不过他并未明确说明对标的是哪个Opus版本，这给外界留下了一些悬念。

技术团队披露的早期评估数据显示，Grok 4.5在多模态处理和复杂逻辑推理任务中表现突出，部分指标已达到行业领先水平。通过持续迭代的人类反馈强化学习机制（RLHF），模型在专业领域知识应用方面展现出显著优势。

马斯克同时强调，RL仍在持续大幅提升模型能力，配套构建的Grok Build调度框架也在每日迭代优化。

四、Grok Build：马斯克版”Claude Code”

除新模型外，马斯克近期推出的首款编码智能体Grok Build也备受关注。可以把它理解成马斯克版”Claude Code”——一个直接跑在命令行里的AI程序员，能读代码、做计划、改文件、跑测试。

其比较明显的差异化设计是Plan Mode（计划模式）：用户描述需求后，它不会直接乱改代码，而是先输出一份结构化的执行计划，列明每一步要做什么。用户可以审阅、修改甚至重写整个计划，批准之后它才开始动手，所有改动以diff形式呈现。

五、激进路线图：SpaceX每月发布全新模型

或许最值得关注的是，马斯克还透露SpaceX今年每个月都会推出一批完全从零开始训练的全新模型。

从”年更”到”月更”，AI行业正在进入”马斯克时间”。三四年前，大模型还是”年更”的奢侈品——GPT-3撑了两年，GPT-4又撑了快两年。而Grok从4.3到4.4再到4.5，参数从0.5T蹦到1T再蹦到1.5T，前后不过两三个月。

首批全新模型已应用于星舰发射参数模拟和轨道计算，测试数据显示计算效率较传统方法提升40%以上。特斯拉方面，经过微调的Grok 4.5能准确识别0.01毫米级的装配误差，检测速度比人工快15倍。

六、Grok生态延伸：FSD语音控制即将落地

在车载场景上，Grok的落地也在加速推进。6月21日，马斯克在回复X用户时明确表示，Grok语音控制特斯拉FSD功能将在”大约三个月左右”上线，预计今年秋季陆续推送至全系特斯拉车辆。

接入Grok后，驾驶员无需手动操作，仅凭自然语言就能操控车辆。例如用户可直接说：”导航去五金店，到店后倒进门店门口的车位”，或是”开回家，直接驶入自家车道”。

结语

从1.5万亿参数的V9基础模型，到Cursor数据的深度整合，再到SpaceX每月从零训练新模型的激进节奏，马斯克正在以一种近乎”火箭发射式”的迭代速度重塑AI行业格局。Grok 4.5的内部测试只是开始，这场围绕算力、数据和应用场景的军备竞赛才刚刚进入下半场。

文章来源：综合自IT之家、新浪财经、机器之心、CryptoBriefing、News.az等多家媒体报道，以及马斯克X平台官方发文。

文章版权归作者所有，未经允许请勿转载。

谷歌I/O 2026深度解析：Gemini重塑Agent生态，AI如何“杀死”旧谷歌？

Grok 4.5内部测试启动：1.5万亿参数V9模型加持，马斯克称性能逼近Opus

一、Grok 4.5核心升级：1.5T参数V9模型 + Cursor数据加持

二、内部测试为何选择SpaceX与特斯拉？

三、性能表现：接近甚至超越Opus

四、Grok Build：马斯克版”Claude Code”

五、激进路线图：SpaceX每月发布全新模型

六、Grok生态延伸：FSD语音控制即将落地

结语

GPT-5.6 宣而不发、Fable 5 归来再禁：美国AI监管风暴下，前沿大模型进入“国家主导”新时代

GPT-5.6发布：Sol/Terra/Luna三档模型+Ultra多智能体模式，编程能力碾压Claude Mythos 5但仅限预览

相关文章

谷歌I/O 2026深度解析：Gemini重塑Agent生态，AI如何“杀死”旧谷歌？

Sakana AI 发布 Fugu：7B参数小模型如何叫板Fable 5？多智能体编排成新出路

GLM-4.7登顶开源编程模型榜首：国产大模型在WebDev竞技场实现关键超越

用Kimi K2.5的Video2Code，半小时“复刻”一个独立站

暂无评论

最新文章

Grok 4.5内部测试启动：1.5万亿参数V9模型加持，马斯克称性能逼近Opus

一、Grok 4.5核心升级：1.5T参数V9模型 + Cursor数据加持

二、内部测试为何选择SpaceX与特斯拉？

三、性能表现：接近甚至超越Opus

四、Grok Build：马斯克版”Claude Code”

五、激进路线图：SpaceX每月发布全新模型

六、Grok生态延伸：FSD语音控制即将落地

结语

GPT-5.6 宣而不发、Fable 5 归来再禁：美国AI监管风暴下，前沿大模型进入“国家主导”新时代

GPT-5.6发布：Sol/Terra/Luna三档模型+Ultra多智能体模式，编程能力碾压Claude Mythos 5但仅限预览

相关文章

谷歌I/O 2026深度解析：Gemini重塑Agent生态，AI如何“杀死”旧谷歌？

Sakana AI 发布 Fugu：7B参数小模型如何叫板Fable 5？多智能体编排成新出路

GLM-4.7登顶开源编程模型榜首：国产大模型在WebDev竞技场实现关键超越

用Kimi K2.5的Video2Code，半小时“复刻”一个独立站

暂无评论

最新文章

标签云