突袭！Qwen3.7-Max-Preview空降Arena全球前列，国产双第一稳了！附通义千问迭代内幕

摘要： 就在业界还在消化Qwen3.6的时候，阿里通义千问悄然放出Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview，并在大模型竞技场上双双拿下国产第一。文本领域Max版冲至全球第13，视觉领域Plus版位列第16，数学、编程等细分赛道更是杀入全球前十。从前负责人林俊旸离任到如今两代“超大杯”并行迭代，Qwen不仅没有减速，反而按下了快进键。本文带你拆解Qwen3.7的实测战绩，并复盘通义千问从万亿参数Qwen3-Max以来的狂飙之路。

如果说大模型圈的发布节奏是按月计算，那阿里这次简直是在按“周”突袭。

谁也没想到，在Qwen3.6-Max还处于预览版阶段的当下，Qwen3.7-Max-Preview就这么悄无声息地被端上了桌。阿里的保密工作做到了极致，直到Arena（原大模型竞技场）官方放榜，大家才恍然大悟：原来通义千问的下一代旗舰，已经暗搓搓地练成了。

🏆 杀入全球前十，国产大模型的体面靠它撑着

这次一起亮相的双子星——Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview，可以说是给国产大模型狠狠长了一波脸。

在最具含金量的文本领域，Qwen3.7-Max-Preview一举拿下全球第13名。看看排在它前面的名字：Claude Opus 4.6/4.7系列、Gemini-3.1/3 Pro系列、GPT-5.4/5.5系列……在顶级闭源模型的围剿下，Qwen3.7-Max-Preview成了全球前十五中唯一的中国模型，也是实打实的国产第一。

更让人惊喜的是它的细分能力，不再偏科，而是硬核赛道的全面开花：

数学：全球第7
专家提示：全球第9
软件/IT：全球第9
Coding：全球第10

而在视觉领域，Qwen3.7-Plus-Preview同样扛起了大旗，排名全球第16，助力阿里在视觉实验室榜单升至全球第5。在这个榜单里，它同样是唯一上榜的中国模型。

如果说之前的Qwen3-Max证明了国产大模型能靠Scaling Law（缩放定律）冲上万亿参数量级并实现性能跃迁，那么如今的Qwen3.7则证明，在极度内卷的全球第一梯队里，国产模型完全有实力在推理和编程等核心维度与国际巨头掰手腕。

突袭！Qwen3.7-Max-Preview空降Arena全球前列，国产双第一稳了！附通义千问迭代内幕

⏩ 从Qwen3到3.7，迭代提速背后的“技术焦虑”

有不少开发者感慨：“人们还没来得及讨论完一个模型，下一个模型的预告片就已经自动播放了。”

这真不是错觉。回溯通义千问的迭代史，你会发现一个明显的分水岭：

在2023年到2024年的早期阶段，Qwen的发布节奏还算“稳重”，从Qwen1.5到Qwen2，间隔大概在4-6个月。但进入Qwen3时代后，大版本间隔直接缩短到了2-3个月，到了2026年更是变成了“月更”模式——2月发3.5，4月发3.6，5月3.7就登场了。

这种近乎狂奔的节奏，其实早有迹可循。早在2025年9月，阿里发布首个超万亿参数模型Qwen3-Max-Preview时，就展示了对架构和工程极限的探索。那是一个采用混合专家架构的庞然大物，总参数超1万亿，但每次推理仅激活约220亿参数，完美平衡了性能与算力消耗。它不仅以64.6分登顶SuperGPQA知识推理榜首，在AIME25数学评测中更是拿到80.6分，甚至在后续的推理增强版中，结合工具调用拿下了AIME和HMMT的满分。

正是这些前期积累的MoE架构经验、Thinking/Non-Thinking双模式推理控制，以及“预览版先行、正式版跟进”的敏捷开发策略，让Qwen团队有了快速试错、高频交付的底气。

🧑‍💻 林俊旸走了，但Qwen的步伐没乱

有意思的是，在这波提速期，Qwen经历了核心人物的变动。

还记得Qwen前负责人林俊旸离开时的那条推文吗？“Qwen的兄弟们，按原来安排继续干，没问题的。”当时不少人担忧，灵魂人物的离场会不会让这支王牌之师陷入阵痛。

事实证明，担忧是多余的。无论是2025年底Qwen3-Max正式版在云栖大会上的惊艳四座（性能超GPT5，跻身全球前三），还是如今Qwen3.7预览版在Arena上的悄然领跑，都在传递一个信号：这支团队已经形成了高度成熟的自驱迭代机制。

目前的普遍节奏是：Preview版本先上线，社区和开发者先进行高强度的实测与反馈，随后正式版打磨跟进。这其实是一种极其聪明的策略——在算力成本极高、模型复杂度爆炸的今天，闭门造车远不如把模型扔到真实的开发环境里“挨揍”来得高效。

💬 写在最后：快点开源吧，开发者等不及了！

在Arena榜单公布后，海外社区的反应比国内还要热烈。有开发者在X上直言：“开源竞争日趋激烈，我们都将从中受益。”还有人呼唤：“希望我们能借此获得非常好的本地化模型！”

毕竟，虽然Qwen3.7的预览版成绩亮眼，但大家心里最惦记的还是那个老问题：正式版什么时候放？什么时候开源？

从万亿参数的Qwen3-Max开始，阿里采取了“闭源核心+开源生态”的双轨制，MoE架构的核心模块融入了开源模型，但超大杯一直作为商业基座通过阿里云百炼平台提供服务。对于苦等本地部署的开发者来说，Qwen3.7的正式开源无疑是下半年最值得期待的事。

技术从不等待任何人，它像一条奔腾的河流。我们既是见证者，也是参与者。面对Qwen这波不讲武德的“闪现”，除了直呼内行，也只能催更了：别只发预览版了，正式版赶紧端上来吧！

文章来源：
[1] 大国Ai导航综合整理
[2] AI产业跟踪：QWEN3-MAX-PREVIEW上线国产大模型持续演进 – 新浪财经
[3] Qwen3-Max-Preview模型简介 – 2048 AI社区
[5] 赛道Hyper | 通义千问万亿模型的战略突围解析 – 腾讯新闻
[9] Max，性能超GPT5，跻身全球前三 – 新浪财经
[10] 中国大模型全景评测：从Kimi到Qwen3-Max – CSDN博客

文章版权归作者所有，未经允许请勿转载。

模型速度进入“4G时代”？实测Gemini 3.5 Flash：Agent效率升维，但性价比争议犹存

突袭！Qwen3.7-Max-Preview空降Arena全球前列，国产双第一稳了！附通义千问迭代内幕

🏆 杀入全球前十，国产大模型的体面靠它撑着

⏩ 从Qwen3到3.7，迭代提速背后的“技术焦虑”

🧑‍💻 林俊旸走了，但Qwen的步伐没乱

💬 写在最后：快点开源吧，开发者等不及了！

谷歌搜不到的80%深网被打通！AnySearch成AI Agent标配搜索基建，开发者连夜接入

QoderWork Design上线：这款AI设计工作台如何凭“设计即代码”硬刚Claude Design？

相关文章

模型速度进入“4G时代”？实测Gemini 3.5 Flash：Agent效率升维，但性价比争议犹存

OpenAI斥资约1亿美元收购Torch，为ChatGPT Health打造核心医疗数据底座

2026最新OpenAI Codex保姆级教程：教你玩转AI编程神器（含避坑指南+实战案例）

🚀智谱GLM-5.2全量开放：1M上下文+下周开源MIT协议，国产AI编程模型迎最强王者！

暂无评论

最新文章

突袭！Qwen3.7-Max-Preview空降Arena全球前列，国产双第一稳了！附通义千问迭代内幕

🏆 杀入全球前十，国产大模型的体面靠它撑着

⏩ 从Qwen3到3.7，迭代提速背后的“技术焦虑”

🧑‍💻 林俊旸走了，但Qwen的步伐没乱

💬 写在最后：快点开源吧，开发者等不及了！

谷歌搜不到的80%深网被打通！AnySearch成AI Agent标配搜索基建，开发者连夜接入

QoderWork Design上线：这款AI设计工作台如何凭“设计即代码”硬刚Claude Design？

相关文章

模型速度进入“4G时代”？实测Gemini 3.5 Flash：Agent效率升维，但性价比争议犹存

OpenAI斥资约1亿美元收购Torch，为ChatGPT Health打造核心医疗数据底座

2026最新OpenAI Codex保姆级教程：教你玩转AI编程神器（含避坑指南+实战案例）

🚀智谱GLM-5.2全量开放：1M上下文+下周开源MIT协议，国产AI编程模型迎最强王者！

暂无评论

最新文章

标签云