
MiMo(小米 MiMo大模型)是由小米公司自主研发的大型人工智能模型体系,采用混合专家(MoE)架构设计,总参数规模突破1万亿,定位面向智能体(Agent)时代的推理与多模态基座模型。该系列涵盖云端推理模型、全模态理解模型、语音合成与识别模型等多个产品线,支持最高100万Token超长上下文,在代码生成、复杂推理、多模态理解等评测中进入全球第一梯队。目前MiMo已通过API开放平台向开发者提供服务,并深度集成至小米手机、汽车及智能家居生态。
小米 MiMo大模型官网入口:https://mimo.mi.com
小米 MiMo大模型API平台:https://platform.xiaomimimo.com
一、产品概述
1.1 基本定位
MiMo大模型是小米”人车家全生态”战略的智能技术基座,旨在为手机、智能汽车、智能家居等多终端场景提供统一的AI能力支撑。与侧重通用对话的传统大模型不同,MiMo从设计之初即聚焦智能体场景,强调复杂任务规划、工具调用、代码执行与多模态感知的协同能力。其研发目标是构建能够自主完成长周期任务的”生产级”AI系统,而非仅提供内容生成或问答服务。
小米于2024年底正式启动基座大模型研发,建设万卡级GPU训练集群,并组建专门的核心研发团队。经过约一年的技术积累,MiMo从单一开源模型发展为覆盖云、端、语音、视觉等多维度的完整模型矩阵。2026年3月与4月,小米密集发布MiMo-V2系列与MiMo-V2.5系列,标志着该模型体系进入商业化落地阶段。
1.2 研发团队背景
MiMo大模型由小米核心技术团队(Core Team)研发打造,团队负责人罗福莉此前担任DeepSeek研究员,于2025年加入小米并主导MiMo大模型研发工作。该团队平均年龄25岁,清华与北大毕业生占比超过60%,博士学历占比55%。团队在模型架构设计、训练效率优化、后训练策略等方面具备完整的技术能力。
二、模型矩阵与版本演进
2.1 版本发展时间线
MiMo大模型的发展可分为三个阶段:
探索期(2025年上半年):2025年4月,小米发布并开源首个专注推理能力的大模型MiMo-7B,参数量为70亿,在数学推理(AIME 2024-2025)和代码竞赛(LiveCodeBench v5)等评测中取得开源模型领先成绩。2025年5月,发布多模态大模型MiMo-VL-7B,扩展视觉理解能力。同年11月,发布具身智能模型MiMo-Embodied及全屋智能探索计划Miloco。
开源爆发期(2025年底):2025年12月,小米发布并开源MiMo-V2-Flash,采用MoE架构,总参数3090亿、激活参数150亿,支持256K上下文长度,在SWE-bench Verified等代码Agent评测中超越所有同期开源模型。
商用成熟期(2026年3月-4月):2026年3月,小米集中发布MiMo-V2-Pro(万亿参数云端推理模型)、MiMo-V2-Omni(全模态理解模型)、MiMo-V2-TTS(语音合成模型)。2026年4月,进一步升级推出MiMo-V2.5系列,包括MiMo-V2.5(原生全模态Agent模型)、MiMo-V2.5-Pro(旗舰推理Agent模型)、MiMo-V2.5-TTS Series(精品音色语音合成)及MiMo-V2.5-ASR(语音识别模型)。
2.2 核心型号详解
MiMo-V2.5-Pro是当前能力最强的旗舰型号,总参数超1万亿,单次推理激活参数420亿,支持100万Token超长上下文。该模型具备原生多模态理解能力(文本、图像、音频、视频),在复杂软件工程、长周期Agent任务等场景下表现突出。内部测试显示,配合工具调用框架时可稳定完成单次超过1000轮工具调用的长周期任务。
MiMo-V2.5定位为通用全模态Agent模型,同样支持100万Token上下文,具备视觉理解、语音识别与文本处理的协同能力。相比Pro版本,该模型在推理速度和API成本方面更具优势,适用于对延迟敏感的日常任务场景。
MiMo-V2.5-TTS Series是小米自研的语音合成大模型,基于上亿小时预训练数据与多码本语音建模架构,支持风格控制、歌唱合成、音色克隆等能力,并提供精品音色TTS和音色设计功能。
MiMo-V2.5-ASR专注于语音识别任务,支持高精度语音转文本。
MiMo-V2-Flash是面向开源社区的高效率推理模型,采用MoE架构(309B总参数/15B激活参数),支持256K上下文,采用MIT开源协议发布,适合需要本地部署或二次开发的场景。
三、技术架构解析
3.1 MoE混合专家架构
MiMo大模型系列采用混合专家(Mixture of Experts,MoE)架构作为核心设计范式。以MiMo-V2.5-Pro为例,其总参数量超过1万亿,但通过专家路由机制,每次前向传播仅激活约420亿参数,在保证模型表达能力的同时显著降低推理计算量。这种”稀疏激活”设计使得万亿级参数模型在实际部署中的算力消耗接近于百亿级密集模型,同时获得更大的知识容量。
3.2 HySparse注意力机制
针对超长上下文场景的计算效率问题,MiMo团队自主研发了HySparse混合稀疏注意力架构。该架构采用全局注意力(Global Attention)与滑动窗口注意力(Sliding Window Attention,SWA)的混合设计,在MiMo-V2.5-Pro中的混合比例为1:7,即仅对少量关键Token执行高密度全局注意力,对其余Token采用轻量化的滑动窗口注意力。
相比标准Transformer的二次方复杂度增长,HySparse架构在处理100万Token长上下文时能够显著降低KV Cache显存占用,提升长文本建模效率。该架构还结合了多Token预测(Multi-Token Prediction,MTP)技术,通过同时预测多个后续Token,将推理速度提升约2至2.6倍。
3.3 多模态融合方案
MiMo-V2.5系列在架构层面实现了原生多模态融合,而非采用后期拼接的”外挂式”方案。模型在底层将文本、视觉与音频数据进行统一编码与联合训练,配备专门的视觉编码器和音频编码器,并通过优化的后训练流程对齐感知、推理与工具调用能力。
这种架构设计使得模型能够直接处理图像、视频、音频与文本的混合输入,实现跨模态信息整合与统一推理。例如,用户可以上传一张冰箱内的食材照片并要求模型推荐晚餐食谱,或提交一段会议录音让模型提取待办事项。
3.4 训练优化技术
在后训练阶段,MiMo采用了多教师在线策略蒸馏(Multi-teacher Online Policy Distillation,MOPD)框架,有效降低训练算力需求。针对强化学习训练中的稀疏奖励问题,团队引入了基于测试难度驱动的代码奖励机制,为不同难度的测试用例分配细粒度分数,提升策略优化效率。此外,团队开发了无缝Rollout引擎,通过连续 rollout、异步奖励计算与提前终止策略,将强化学习训练速度提升约2.29倍。
四、核心能力评测
4.1 代码与推理能力
在软件工程类评测中,MiMo-V2.5-Pro展现出一线竞争力。SWE-bench Pro评测得分57.3%,超过Claude Opus 4.6的53.4%;SWE-bench Verified得分79.6%,与Claude Sonnet 4.6持平;Terminal-Bench 2.0得分57.3%,接近Claude Opus 4.6水平。在内部测试MiMo Coding Bench中,该模型在日常编码任务上的表现与顶尖前沿模型处于同一水平。
一个代表性的应用案例是,MiMo-V2.5-Pro曾独立参与北京大学编译原理课程项目,使用Rust语言开发完整SysY编译器。该项目通常需要本科生投入数周时间完成,而模型在4.3小时内通过672次工具调用完成了全部开发流程,并在未公开的测试集中获得满分。
4.2 Agent任务表现
在智能体评测基准Claw-Eval中,MiMo-V2.5(无工具)得分62.3,使用工具后得分提升至更高水平,在实际部署所需的性能与效率平衡上处于前沿位置。MiMo-V2.5-Pro在相同评测中得分更高,表现出更强的长周期任务执行能力。GDPval-AA评测中,MiMo-V2-Pro取得1426 Elo分数,在中国 origin 模型中处于领先水平。
根据第三方评测机构Artificial Analysis发布的全球大模型综合智能指数,MiMo-V2.5-Pro在开源大模型中并列第一,在全球所有大模型中进入前五名;其Agent专项指数位居开源大模型榜首。
4.3 多模态理解能力
MiMo-V2.5和MiMo-V2.5-Pro支持原生图像、音频与视频理解。音频理解方面,支持超过10小时的连续长音频处理,覆盖环境声分类、多说话人分离等复杂场景。图像理解方面,在多学科视觉推理与复杂图表分析上逼近顶尖闭源模型水平。视频理解方面,支持原生音视频联合输入处理,在架构层面实现真正的多模态理解而非简单的分模块拼接。
五、API服务与定价
5.1 接入方式
开发者可通过以下渠道接入MiMo大模型API:
官方API平台:访问 platform.xiaomimimo.com 注册账号并获取API Key,接口兼容OpenAI SDK格式,仅需替换base URL与模型名称即可集成。支持1M Token上下文窗口。
OpenRouter平台:MiMo-V2系列模型已在OpenRouter上架,已有OpenRouter集成经验的开发者可直接调用,模型ID为 xiaomi/mimo-v2.5-pro 等。
Agent开发框架:MiMo已与OpenClaw、OpenCode、KiloCode、Blackbox、Cline等主流Agent框架完成集成,开发者可在这些框架中直接选择MiMo作为底层模型。
在线体验平台:访问 aistudio.xiaomimimo.com 可免费体验MiMo Claw功能,无需API Key即可感受模型的Agent能力。
5.2 价格体系
MiMo-V2.5-Pro的API定价采用分段计费模式:
| 上下文范围 | 输入价格($/百万Token) | 输出价格($/百万Token) |
|---|---|---|
| 256K以内 | 1.00 | 3.00 |
| 1M以内 | 2.00 | 6.00 |
MiMo-V2.5(通用全模态模型)定价为输入0.40美元/百万Token,输出2.00美元/百万Token。MiMo-V2.5-TTS Series目前限时免费。此外,每日北京时间零点至八点期间,所有模型的Credits消耗在原有基础上额外享受八折优惠。
与同级别模型相比,MiMo的API价格约为Claude Opus 4.6、GPT-5.4等顶尖闭源模型的1/5至1/8,在输出Token成本方面差距尤为明显。这一定价策略明显面向开发者生态的快速渗透需求。
六、应用场景与生态布局
6.1 智能编程助手
MiMo大模型在软件开发场景中展现出显著的生产力提升价值。基于MiMo-V2.5-Pro构建的AI编程助手支持20余种编程语言,可执行代码生成、代码重构、Bug调试、测试用例编写、技术文档生成等任务。在工程实践中,使用该模型的开发团队反馈代码生成效率提升约45%,新成员上手速度加快约60%。模型在处理跨文件代码理解、大规模代码库分析等长上下文任务时尤为出色。
6.2 办公文档处理
MiMo-V2-Omni和MiMo-V2.5系列已与金山办公深度合作,接入WPS灵犀平台,支持直接生成Word文档、结构化Excel表格、排版规范的PDF文件及完整演示PPT。MiMo Studio的Claw模块原生支持Word、Excel、PPT、PDF四大主流格式,覆盖超过95%的日常文档类型。在办公场景中,模型可用于万字会议纪要的核心要点提炼、长文档的智能摘要与问答、多格式文档的批量转换与数据提取。
6.3 智能家居与车联网
MiMo大模型是小米”人车家全生态”的智能中枢组件。2025年11月发布的小米全屋智能方案Miloco基于MiMo构建,专为家居场景优化的视觉-语言多模态模型支持本地运行,连接米家平台超过10亿台设备,能够根据实时上下文自主判断并执行家居控制指令,摆脱传统智能家居依赖”规则预设”的局限。在智能汽车领域,MiMo的训练方法论已应用于小米汽车端到端辅助驾驶系统的迭代升级。
6.4 手机端智能体
2026年3月,小米发布基于MiMo大模型的AI交互测试产品Xiaomi miclaw,定位为国内首个手机端类OpenClaw智能体应用。该产品将MiMo的Agent能力深度集成至手机操作系统层级,支持系统级工具调用、跨应用任务执行、语音交互与视觉感知等功能。用户可通过自然语言指令完成复杂的多步骤任务,如”帮我查一下上周去上海的机票价格,然后订一个离虹桥站近的酒店,再把确认信息发给微信里的张三”。
七、开源与生态战略
MiMo系列模型在开源与商业闭源之间采取了分层策略。MiMo-V2-Flash(309B参数)采用MIT协议完全开源,模型权重和推理代码可在Hugging Face等平台获取。MiMo-V2.5和MiMo-V2.5-Pro也已确认将面向全球开源,具体时间表尚未公布。
在商业层面,小米通过激进的API定价策略吸引开发者生态,MiMo-V2.5-Pro的价格约为同级竞品的1/5,MiMo-V2.5的输出价格仅为Pro版本的一半左右。这种”高性价比API+开源权重”的组合策略,旨在快速推动MiMo在开发者社区和B端客户中的渗透。
小米已 announced 未来三年在AI领域计划投入超过600亿元人民币,持续扩建万卡级GPU训练集群,迭代MiMo模型能力,并围绕”人车家”场景构建AI应用生态。
文章来源与版权说明
本文内容整理自小米官方发布信息、MiMo大模型官网及API开放平台、第三方评测机构Artificial Analysis、公开市场研究报告等公开渠道,部分技术参数与评测数据可能随模型版本更新而发生变化,请以小米官方最新公告为准。
本文版权归大国AI导航(daguoai.com)所有。未经授权,任何单位或个人不得转载、摘编或以其他方式使用本文内容。如需转载,请联系本站获取授权。文中涉及的第三方商标、产品名称归各自权利人所有。
数据评估
本站大国Ai提供的小米 MiMo大模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由大国Ai实际控制,在2026年4月24日 上午10:44收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,大国Ai不承担任何责任。
相关导航


GPT5.5

Qwen3.6-Plus

妙想金融Ai

Claude 4.5
Kimi K2 Thinking

MiniMax AI | AGI

