腾讯混元翻译模型1.5开源:手机端1GB内存流畅运行,性能比肩顶级闭源模型

Ai资讯2天前发布 大国Ai
60 0 0

摘要: 腾讯混元于2025年12月30日正式开源其翻译模型1.5版本,推出Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B两款模型。其中,1.8B模型专为手机等端侧设备优化,仅需1GB内存即可实现离线实时翻译,其翻译效果在权威测试中达到Gemini-3.0-Pro等超大闭源模型的90%水平,而平均响应时间仅0.18秒,快于主流商用API。该系列模型支持33种语言及5种民汉/方言互译,并具备术语库自定义、长上下文理解等实用功能,标志着高性能AI翻译向轻量化、普惠化迈出关键一步。


一、双模型协同:端侧与云侧的效率与性能平衡

腾讯混元翻译模型1.5采用了创新的“轻量端侧+高性能云端”双模型架构,旨在满足不同场景下的差异化需求。

Tencent-HY-MT1.5-1.8B是本次发布的亮点,它是一款面向消费级设备的轻量化模型。经过量化后,该模型仅需1GB内存即可在手机等设备上流畅运行,支持离线实时翻译。在效率上,其处理50个tokens的平均耗时仅为0.18秒,相比其他主流商用翻译API约0.4秒的速度,快了一倍以上。这使得它非常适合即时通讯、移动翻译应用等高吞吐、低延迟的场景。

腾讯混元翻译模型1.5开源:手机端1GB内存流畅运行,性能比肩顶级闭源模型

Tencent-HY-MT1.5-7B则是性能担当,它是此前在WMT25国际机器翻译大赛中获得30个语种冠军的模型的升级版。新版重点提升了翻译准确率,大幅减少了译文中夹带无关注释和语种混杂的情况,在处理学术论文、商务合同等复杂专业文本时更具优势。

在实际部署中,用户可以根据需求,将1.8B模型部署在端侧用于实时响应,将7B模型部署在云端处理复杂任务,通过端云协同来提升翻译效果的一致性和系统稳定性。

二、性能实测:小模型实现跨级表现,效果媲美大模型

在翻译质量方面,1.8B小模型实现了令人瞩目的跨级表现。在常用的FLORES-200、WMT25以及民汉语言测试集中,Tencent-HY-MT1.5-1.8B全面超越了中等尺寸的开源模型和主流商用翻译API。其效果达到了Gemini-3.0-Pro这种超大尺寸闭源模型的90分位水平,在部分测试集上仅略微落后于后者。具体而言,在FLORES-200质量评估中取得了约78%的分数。

这意味着,开发者或企业现在可以用一个能在手机上离线运行的小模型,获得接近世界顶级闭源大模型的翻译质量,同时享有更快的速度和更低的成本。

三、广泛的语言支持与场景化深度适配

该模型系列支持33个语种互译以及5种民汉/方言,覆盖范围广泛。除了中文、英语、日语等常见语言,还包含捷克语、马拉地语、爱沙尼亚语、冰岛语等资源相对稀缺的小语种。这为全球化应用和服务提供了强大的语言基础。

更重要的是,模型针对实际应用痛点进行了深度优化,具备三大核心实用功能:

  1. 术语库自定义:用户可为医学、法律、金融、科技等专业领域构建专属术语对照表,确保翻译中关键术语的一致性与准确性。
  2. 长上下文理解:模型能够基于前文语境优化后续翻译,显著提升长对话、会议记录、技术文档等长篇内容的翻译连贯性,避免指代不清或语义断裂。
  3. 带格式翻译:能够保持网页、文档等原文的格式信息(如标记、排版)不变,使翻译结果更可直接使用。

四、技术核心:On-Policy Distillation实现小模型能力跃迁

HY-MT1.5-1.8B能以小尺寸实现大模型的效果,得益于一项名为 “On-Policy Distillation”(大尺寸模型蒸馏) 的关键技术。

与传统“离策略”蒸馏不同,该技术让HY-MT1.5-7B大模型作为“教师”,在训练过程中实时引导1.8B的“学生”模型。教师模型会对学生模型生成的每一个token进行评估和指导,让学生在自己真实推理可能遇到的错误路径中学习如何纠正。这种方法避免了传统蒸馏中学生模型“死记硬背”标准答案、遇到未知情况时错误累积的弊端,从而显著提升了小模型的泛化能力和实际表现。

五、开源生态与广泛应用前景

目前,两个模型均已上线腾讯混元官网,并在GitHub、Hugging Face、ModelScope等主流开源社区开放下载,支持Arm、高通、Intel、沐曦等多个硬件平台部署。

腾讯混元翻译模型已在腾讯会议、企业微信、QQ浏览器、客服翻译等内部业务场景中落地应用。此次开源将大幅降低高质量AI翻译技术的应用门槛,使广大开发者和中小企业能够以便捷的方式,获得此前可能只有大型企业才能负担得起的翻译能力,有望推动跨语言沟通进入更普惠的“无障碍”时代。


文章来源:综合自央广网、中华网、中关村在线、手机中国等媒体报道及腾讯混元官方开源页面。

© 版权声明

相关文章

暂无评论

none
暂无评论...