突袭!Qwen3.7-Max-Preview空降Arena全球前列,国产双第一稳了!附通义千问迭代内幕

Ai资讯1天前发布 大国Ai
232 0 0

摘要: 就在业界还在消化Qwen3.6的时候,阿里通义千问悄然放出Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview,并在大模型竞技场上双双拿下国产第一。文本领域Max版冲至全球第13,视觉领域Plus版位列第16,数学、编程等细分赛道更是杀入全球前十。从前负责人林俊旸离任到如今两代“超大杯”并行迭代,Qwen不仅没有减速,反而按下了快进键。本文带你拆解Qwen3.7的实测战绩,并复盘通义千问从万亿参数Qwen3-Max以来的狂飙之路。


如果说大模型圈的发布节奏是按月计算,那阿里这次简直是在按“周”突袭。

谁也没想到,在Qwen3.6-Max还处于预览版阶段的当下,Qwen3.7-Max-Preview就这么悄无声息地被端上了桌。阿里的保密工作做到了极致,直到Arena(原大模型竞技场)官方放榜,大家才恍然大悟:原来通义千问的下一代旗舰,已经暗搓搓地练成了。

🏆 杀入全球前十,国产大模型的体面靠它撑着

这次一起亮相的双子星——Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview,可以说是给国产大模型狠狠长了一波脸。

在最具含金量的文本领域,Qwen3.7-Max-Preview一举拿下全球第13名。看看排在它前面的名字:Claude Opus 4.6/4.7系列、Gemini-3.1/3 Pro系列、GPT-5.4/5.5系列……在顶级闭源模型的围剿下,Qwen3.7-Max-Preview成了全球前十五中唯一的中国模型,也是实打实的国产第一。

更让人惊喜的是它的细分能力,不再偏科,而是硬核赛道的全面开花:

  • 数学:全球第7
  • 专家提示:全球第9
  • 软件/IT:全球第9
  • Coding:全球第10

而在视觉领域,Qwen3.7-Plus-Preview同样扛起了大旗,排名全球第16,助力阿里在视觉实验室榜单升至全球第5。在这个榜单里,它同样是唯一上榜的中国模型。

如果说之前的Qwen3-Max证明了国产大模型能靠Scaling Law(缩放定律)冲上万亿参数量级并实现性能跃迁,那么如今的Qwen3.7则证明,在极度内卷的全球第一梯队里,国产模型完全有实力在推理和编程等核心维度与国际巨头掰手腕。

突袭!Qwen3.7-Max-Preview空降Arena全球前列,国产双第一稳了!附通义千问迭代内幕

⏩ 从Qwen3到3.7,迭代提速背后的“技术焦虑”

有不少开发者感慨:“人们还没来得及讨论完一个模型,下一个模型的预告片就已经自动播放了。”

这真不是错觉。回溯通义千问的迭代史,你会发现一个明显的分水岭:

在2023年到2024年的早期阶段,Qwen的发布节奏还算“稳重”,从Qwen1.5到Qwen2,间隔大概在4-6个月。但进入Qwen3时代后,大版本间隔直接缩短到了2-3个月,到了2026年更是变成了“月更”模式——2月发3.5,4月发3.6,5月3.7就登场了。

这种近乎狂奔的节奏,其实早有迹可循。早在2025年9月,阿里发布首个超万亿参数模型Qwen3-Max-Preview时,就展示了对架构和工程极限的探索。那是一个采用混合专家架构的庞然大物,总参数超1万亿,但每次推理仅激活约220亿参数,完美平衡了性能与算力消耗。它不仅以64.6分登顶SuperGPQA知识推理榜首,在AIME25数学评测中更是拿到80.6分,甚至在后续的推理增强版中,结合工具调用拿下了AIME和HMMT的满分。

正是这些前期积累的MoE架构经验、Thinking/Non-Thinking双模式推理控制,以及“预览版先行、正式版跟进”的敏捷开发策略,让Qwen团队有了快速试错、高频交付的底气。

🧑‍💻 林俊旸走了,但Qwen的步伐没乱

有意思的是,在这波提速期,Qwen经历了核心人物的变动。

还记得Qwen前负责人林俊旸离开时的那条推文吗?“Qwen的兄弟们,按原来安排继续干,没问题的。”当时不少人担忧,灵魂人物的离场会不会让这支王牌之师陷入阵痛。

事实证明,担忧是多余的。无论是2025年底Qwen3-Max正式版在云栖大会上的惊艳四座(性能超GPT5,跻身全球前三),还是如今Qwen3.7预览版在Arena上的悄然领跑,都在传递一个信号:这支团队已经形成了高度成熟的自驱迭代机制。

目前的普遍节奏是:Preview版本先上线,社区和开发者先进行高强度的实测与反馈,随后正式版打磨跟进。这其实是一种极其聪明的策略——在算力成本极高、模型复杂度爆炸的今天,闭门造车远不如把模型扔到真实的开发环境里“挨揍”来得高效。

💬 写在最后:快点开源吧,开发者等不及了!

在Arena榜单公布后,海外社区的反应比国内还要热烈。有开发者在X上直言:“开源竞争日趋激烈,我们都将从中受益。”还有人呼唤:“希望我们能借此获得非常好的本地化模型!”

毕竟,虽然Qwen3.7的预览版成绩亮眼,但大家心里最惦记的还是那个老问题:正式版什么时候放?什么时候开源?

从万亿参数的Qwen3-Max开始,阿里采取了“闭源核心+开源生态”的双轨制,MoE架构的核心模块融入了开源模型,但超大杯一直作为商业基座通过阿里云百炼平台提供服务。对于苦等本地部署的开发者来说,Qwen3.7的正式开源无疑是下半年最值得期待的事。

技术从不等待任何人,它像一条奔腾的河流。我们既是见证者,也是参与者。面对Qwen这波不讲武德的“闪现”,除了直呼内行,也只能催更了:别只发预览版了,正式版赶紧端上来吧!


文章来源:
[1] 大国Ai导航综合整理
[2] AI产业跟踪:QWEN3-MAX-PREVIEW上线 国产大模型持续演进 – 新浪财经
[3] Qwen3-Max-Preview模型简介 – 2048 AI社区
[5] 赛道Hyper | 通义千问万亿模型的战略突围解析 – 腾讯新闻
[9] Max,性能超GPT5,跻身全球前三 – 新浪财经
[10] 中国大模型全景评测:从Kimi到Qwen3-Max – CSDN博客

© 版权声明

相关文章

暂无评论

none
暂无评论...