Grok 4.5内部测试启动:1.5万亿参数V9模型加持,马斯克称性能逼近Opus

Ai资讯4小时前发布 大国Ai
35 0 0

摘要:2026年6月28日,马斯克在X平台官宣Grok 4.5已在SpaceX特斯拉内部启动私有测试。该模型基于1.5万亿参数V9基础大模型打造,补充训练阶段引入Cursor数据,早期评测显示性能接近甚至有望超越Anthropic的Opus模型。此外,SpaceX今年将每月推出一款从零训练的全新模型,迭代节奏堪称激进。


一、Grok 4.5核心升级:1.5T参数V9模型 + Cursor数据加持

马斯克今日在X平台发文披露了Grok 4.5的最新进展。这款新一代模型基于xAI自研的1.5万亿参数V9基础大模型打造,并在补充训练阶段加入了Cursor数据。

值得一提的是,Cursor是今年4月份SpaceX官方宣布以600亿美元收购权利的AI代码编辑器,其数据包含真实的开发者工作流(写代码、调试、迭代、修复bug等),是”人类开发者如何思考”的映射。如果Grok新模型能够有效利用这些数据,那么它将更懂真实开发者的工作方式,而非只是GitHub上的公开代码。

Grok 4.5内部测试启动:1.5万亿参数V9模型加持,马斯克称性能逼近Opus

从参数规模来看,Grok 4.5实现了显著跃升。公开资料显示,Grok 4.4参数为1万亿,而Grok 4.5升级至1.5万亿,相当于50%的参数提升。 对比当前承载所有Grok生产流量的0.5T v8-small(外部测试版本Grok 4.2),新模型规模直接扩大了3倍。

二、内部测试为何选择SpaceX与特斯拉?

Grok 4.5目前已在SpaceX和特斯拉内部开启私有测试。据内部人士透露,测试范围覆盖了工程模拟、供应链优化等核心业务场景。

这一选择背后有明确的战略逻辑——两家公司均处于硬件工程、软件系统与实时决策的交汇点。SpaceX可提供火箭轨迹计算、轨道模拟等场景,特斯拉则侧重制造流程优化、电池生产线质量检测、自动驾驶数据标注等任务。

行业评论认为,这种内部测试策略赋予了xAI竞争对手难以复制的优势:访问世界级工程组织的专有运营数据。多数AI公司在公开基准测试和合成任务上验证模型,而xAI得以在真实的火箭轨迹和车辆制造流程中进行测试。

三、性能表现:接近甚至超越Opus

马斯克透露,早期评测结果显示Grok 4.5的性能接近甚至有望超越Opus模型。 不过他并未明确说明对标的是哪个Opus版本,这给外界留下了一些悬念。

技术团队披露的早期评估数据显示,Grok 4.5在多模态处理和复杂逻辑推理任务中表现突出,部分指标已达到行业领先水平。通过持续迭代的人类反馈强化学习机制(RLHF),模型在专业领域知识应用方面展现出显著优势。

马斯克同时强调,RL仍在持续大幅提升模型能力,配套构建的Grok Build调度框架也在每日迭代优化。

四、Grok Build:马斯克版”Claude Code”

除新模型外,马斯克近期推出的首款编码智能体Grok Build也备受关注。可以把它理解成马斯克版”Claude Code”——一个直接跑在命令行里的AI程序员,能读代码、做计划、改文件、跑测试。

其比较明显的差异化设计是Plan Mode(计划模式):用户描述需求后,它不会直接乱改代码,而是先输出一份结构化的执行计划,列明每一步要做什么。用户可以审阅、修改甚至重写整个计划,批准之后它才开始动手,所有改动以diff形式呈现。

五、激进路线图:SpaceX每月发布全新模型

或许最值得关注的是,马斯克还透露SpaceX今年每个月都会推出一批完全从零开始训练的全新模型。

从”年更”到”月更”,AI行业正在进入”马斯克时间”。三四年前,大模型还是”年更”的奢侈品——GPT-3撑了两年,GPT-4又撑了快两年。而Grok从4.3到4.4再到4.5,参数从0.5T蹦到1T再蹦到1.5T,前后不过两三个月。

首批全新模型已应用于星舰发射参数模拟和轨道计算,测试数据显示计算效率较传统方法提升40%以上。特斯拉方面,经过微调的Grok 4.5能准确识别0.01毫米级的装配误差,检测速度比人工快15倍。

六、Grok生态延伸:FSD语音控制即将落地

在车载场景上,Grok的落地也在加速推进。6月21日,马斯克在回复X用户时明确表示,Grok语音控制特斯拉FSD功能将在”大约三个月左右”上线,预计今年秋季陆续推送至全系特斯拉车辆。

接入Grok后,驾驶员无需手动操作,仅凭自然语言就能操控车辆。例如用户可直接说:”导航去五金店,到店后倒进门店门口的车位”,或是”开回家,直接驶入自家车道”。


结语

从1.5万亿参数的V9基础模型,到Cursor数据的深度整合,再到SpaceX每月从零训练新模型的激进节奏,马斯克正在以一种近乎”火箭发射式”的迭代速度重塑AI行业格局。Grok 4.5的内部测试只是开始,这场围绕算力、数据和应用场景的军备竞赛才刚刚进入下半场。


文章来源:综合自IT之家、新浪财经、机器之心、CryptoBriefing、News.az等多家媒体报道,以及马斯克X平台官方发文。

© 版权声明

相关文章

暂无评论

none
暂无评论...