小米发布开源大模型MiMo-V2-Flash:以“极致性价比”杀入AI竞赛,剑指人车家全生态

Ai资讯2周前发布 大国Ai
176 0 0

摘要:2025年12月17日,小米集团在“人车家全生态”合作伙伴大会上,正式发布并开源其新一代AI大模型Xiaomi MiMo-V2-Flash。该模型凭借3090亿总参数、150亿激活参数的MoE(专家混合)架构,在多项基准测试中性能媲美DeepSeek-V3.2等头部开源模型。其核心突破在于通过创新的混合注意力机制与多令牌预测技术,实现了高达每秒150个token的生成速度,同时将推理成本降至行业标杆的几分之一,以“小米式”的极致性价比策略,正式宣告其成为AI大模型赛道的有力竞争者。

小米发布开源大模型MiMo-V2-Flash:以“极致性价比”杀入AI竞赛,剑指人车家全生态

一、 技术核心:效率至上,重新定义开源模型“性价比”

此次发布的MiMo-V2-Flash,并非单纯追求参数规模的“巨无霸”,而是将“极致推理效率”作为设计的首要原则。小米MiMo大模型负责人罗福莉在演讲中指出,下一代智能体(Agent)的核心在于高效执行与全能感知,而实现这一目标的关键是拥有一个推理效率极高的模型结构。

为实现这一目标,模型采用了两大关键技术创新:

  1. 混合滑动窗口注意力机制(Hybrid SWA):模型采用5:1比例交错使用128窗口的滑动窗口注意力(SWA)与全局注意力。这一设计将处理长文本所需的KV缓存(Key-Value Cache)固定下来,避免了随着上下文长度增加而无限增长的计算负担,从而大幅降低了硬件压力和推理成本。罗福莉团队在实验中意外发现,128的窗口大小是一个“神奇的最佳甜点值”,盲目扩大窗口反而会导致性能下降。
  2. 多层多令牌预测(MTP):传统模型一次只预测一个token(词元),而MiMo-V2-Flash通过原生集成MTP层,能够并行预测多个后续token。这项技术带来了约2.5倍的推理速度提升,尤其在代码生成等任务上效果显著,有效解决了小批量强化学习训练中因“长尾样本”导致的GPU空闲问题。

正是这些底层创新,使得MiMo-V2-Flash在拥有顶尖性能的同时,实现了惊人的成本控制。其API定价为输入每百万token 0.7元,输出每百万token 2.1元。据官方对比,其推理速度是DeepSeek-V3.2的近3倍,而成本仅为后者的一半;与综合性能相近的Gemini 2.5 Pro相比,速度持平,但成本仅为对方的约1/20。

二、 性能表现:全面对标顶尖模型,代码能力尤为突出

根据小米官方公布的基准测试结果,MiMo-V2-Flash在多项关键评测中表现亮眼,已跻身全球顶级开源模型行列。

  • 编程与智能体任务:在衡量模型修复真实世界软件Bug能力的SWE-Bench基准测试中,其Verified(已验证)得分达到73.4%,在多语言版本(Multilingual)中得分71.7%,均创造了开源模型的新纪录(SOTA)。在面向智能体任务的τ²-Bench测试中,其在通信、零售等分类中也取得了高分。
  • 综合能力:在AIME 2025数学竞赛、GPQA-Diamond科学知识测试中,模型均位列开源模型前两名。其代码能力被官方宣称可媲美顶尖闭源模型Claude 4.5 Sonnet,而推理成本仅为后者的2.5%。
  • 长上下文支持:模型原生支持32K上下文,并通过技术扩展至256K,足以处理一本中等篇幅的小说或复杂的技术文档,为多轮智能体交互和复杂任务处理提供了基础。

三、 战略意图:不止于模型,更是小米AI生态的基石

此次发布并非孤立事件,而是小米AI战略的关键落子。在大会上,小米集团总裁卢伟冰披露了小米“人车家全生态”的最新数据:全球月活用户达7.42亿,AIoT平台连接设备数突破10.4亿。如此庞大的硬件生态,亟需一个统一、高效且成本可控的AI大脑进行驱动。

罗福莉的演讲清晰地传达了这一战略方向。她认为,当前大多数模型只是“完美的语言外壳,没有锚定现实世界的物理模型”,而真正的智能应从与物理世界的交互中“活”出来。因此,MiMo-V2-Flash从设计之初就专注于为智能体(Agent)提供高效的“沟通语言”(代码与工具调用能力)和“高带宽”的协作基础。这一定位直指小米的汽车、手机、智能家居等硬件产品线,旨在让AI能力从纯语言交互,深度融入并操控物理世界。

此外,小米采用了激进的全面开源策略。不仅模型权重和推理代码在Hugging Face上以MIT协议开源,其创新的后训练范式“多教师在线策略蒸馏(MOPD)”也公之于众。该技术能以不到传统方法1/50的计算量,让学生模型达到教师模型的性能峰值,为行业提供了高效迭代模型的新路径。这一举措既彰显了技术自信,也意在吸引广大开发者,快速构建围绕小米模型的生态。

四、 “天才少女”掌舵:小米AI研发的“极客化”转身

此次发布会也是小米大模型新负责人罗福莉的首次公开亮相。这位出生于1995年的技术专家,因在AI顶级会议ACL上单年发表8篇论文的成就而被业界称为“AI天才少女”。她职业生涯历经阿里达摩院、幻方量化与DeepSeek,曾主导开发多语言模型VECO并参与研发DeepSeek-V2,是国产大模型领域的顶尖人才。

今年年初,小米创始人雷军被曝以千万年薪力邀罗福莉加盟的消息曾登上热搜。她的最终加入,被市场视为小米AI研发走向“正规军化”和“极客化”的重要里程碑。罗福莉在演讲中强调,在大模型的竞争中,“算力和数据也并非最终的护城河,真正的护城河是科学的研究文化与方法,是将未知问题结合模型优势转化为可用产品的能力。”这或许预示着,小米的AI之路将更侧重于精巧的工程架构与高效的落地转化,而非单纯的规模竞赛。

结语 小米MiMo-V2-Flash的发布,是2025年末AI开源领域的一枚重磅炸弹。它以其在性能、速度与成本之间取得的突破性平衡,重新定义了开源大模型的“性价比”标杆。这不仅是小米在AI技术上的亮剑,更是为其庞大的“人车家全生态”铺设核心AI底座的战略宣言。在罗福莉的带领下,小米的AI故事正从“性价比硬件”迈向“性价比智能”,其后续发展值得持续关注。


文章来源:本文由大国AI导航(daguoai.com)综合撰写,信息整合自小米官方发布、2025小米“人车家全生态”合作伙伴大会公开演讲、界面新闻、证券时报网等媒体报道,以及APPSO等科技自媒体分析。所有引用数据与观点均来自可公开获取的权威信源。

© 版权声明

相关文章

暂无评论

none
暂无评论...