Qwen3.6-35B-A3B：小身材大能量的AI新星，智能体编程与多模态全能手

摘要：2026年4月，阿里通义千问团队开源了一款名为Qwen3.6-35B-A3B的AI大模型，在技术社区引起了广泛关注。它最引人注目的特点是拥有“小身材大能量”：总参数量高达350亿，但在实际推理时，每次仅激活30亿参数。这意味着它的运行消耗接近一个小模型，性能却足以媲美甚至超越许多参数量大得多的竞争对手，尤其在智能体编程和多模态理解方面表现卓越。本文将带你了解这款模型的核心特性、强大能力以及多种体验方式。

初识Qwen3.6-35B-A3B：小身材大能量的AI新星

你可能听说过AI模型参数动辄千亿，对算力要求极高。但Qwen3.6-35B-A3B走了一条不同的“高效”路线。它是一种采用混合专家（MoE）架构的模型。你可以把它想象成一个拥有256位各领域专家的超级智库，但每次处理你的问题时，系统只会根据问题类型，智能地唤醒其中最相关的8位专家和1位全能专家来工作。其他专家则处于“休眠”状态。这样一来，模型在“学习”阶段吸收了海量知识（350亿参数），但在“应用”阶段非常节俭（仅激活30亿参数），实现了出色的能效比。

它的技术底子也很特别，并非传统的单一架构，而是创新性地将**Gated DeltaNet（线性注意力）和Gated Attention（标准注意力）**两种技术交替堆叠融合在一起，再结合上述的MoE层，共同构成了其高效推理的基础。

核心能力：编程与视觉双修的全能选手

这款模型主打两大核心能力，而且表现都超出了人们对这个“体型”模型的预期。

卓越的智能体编程能力：这是它最大的亮点。所谓“智能体编程”，指的是AI不仅能生成代码片段，还能像程序员一样理解复杂项目上下文、规划工作流、调试错误，完成实际的开发任务。在多项硬核评测中，它的表现令人印象深刻：
- SWE-bench Verified：得分73.4，在解决真实世界软件工程问题上能力强劲。
- Terminal-Bench 2.0：得分51.5，相比前代提升了11个百分点，在终端编码任务上进步显著。
- QwenWebBench（前端）：得分高达1397，这意味着它在“一句话生成一个网页应用”这类实际前端任务上有了质的飞跃，被描述为“把上一代甩出了一条街”。
强大的多模态感知与推理：它原生支持视觉和语言，并非简单拼接，而是内置了视觉编码器，能真正理解图片内容。在视觉语言基准测试中，其表现已与业界顶尖的Claude Sonnet 4.5模型持平甚至部分超越，尤其在空间智能（如理解物体位置关系）上优势突出（RefCOCO: 92.0）。它还原生支持超长上下文（26.2万tokens），并能扩展到百万tokens，适合处理长文档或复杂对话。

此外，模型新增了一个对智能体任务极其友好的功能——“思维保留”（preserve_thinking）。开启后，AI在多轮对话中会保留并复用之前的思考链条，避免了重复推理，让处理复杂多步任务时更高效、更连贯。

如何体验与使用：从云端到本地的多种选择

无论你是想快速尝鲜，还是希望部署到自己的服务器或电脑上，都有对应的路径。

在线体验（最简单）：
- 访问 Qwen Studio (https://chat.qwen.ai/) 即可直接与模型进行交互对话。
调用API服务（适合开发者）：
- 通过 阿里云百炼 平台，可以以 qwen3.6-flash 的名称调用其API服务。API支持开启上述的“思维保留”功能以优化智能体任务。
本地部署（追求控制与隐私）：
- 下载权重：模型已在 ModelScope (https://modelscope.cn/models/Qwen/Qwen3.6-35B-A3B) 和 Hugging Face 上开源，可下载权重自行部署。
- 部署工具：推荐使用 vLLM 或 SGLang 等高性能推理引擎进行部署。如果只需文本能力，可关闭视觉部分以提升效率。
- 个人电脑运行：通过 Unsloth 等工具提供的GGUF量化版本，用户甚至可以在拥有22GB左右内存的Mac或PC上，利用llama.cpp本地运行此模型，实现完全离线的智能体编程体验。
集成编程助手（提升开发效率）：
该模型可以无缝集成到流行的AI编程助手中，让你在熟悉的工具里获得它的强大能力：
- Qwen Code：专为Qwen系列优化的终端智能体。
- OpenClaw：一款可自托管、开源的AI编码智能体。
- Claude Code：得益于对Anthropic API协议的兼容，你可以直接在Claude Code的界面中调用Qwen模型的能力。

总结来说，Qwen3.6-35B-A3B以其独特的稀疏高效架构，在智能体编程和多模态理解两大关键领域树立了新的标杆。它证明了优秀的模型不一定需要巨量的实时计算消耗，通过精巧的设计，同样能在保持低成本、高效率的同时，提供顶尖的实用性能。对于开发者、研究者和技术爱好者而言，这无疑是一个值得关注和尝试的强大开源工具。

文章来源：本文信息综合自阿里通义千问官方发布、IT之家、网易订阅等科技媒体报道，以及daguoai.com的读者投稿。

Ai资讯 # Qwen3.6-35B-A3B # Qwen3.6-35B-A3B教程

文章版权归作者所有，未经允许请勿转载。

Qwen3.6-35B-A3B：小身材大能量的AI新星，智能体编程与多模态全能手

初识Qwen3.6-35B-A3B：小身材大能量的AI新星

核心能力：编程与视觉双修的全能选手

如何体验与使用：从云端到本地的多种选择

Claude Opus 4.7正式发布：编程、金融、视觉全面进化，普通人也能用的AI助手

OpenAI图像生成新王者：GPT Image 2如何让AI绘图进入“实用时代”

相关文章

Skills实现“降维打击”：自然语言工作流如何终结低代码的“赛博绣花”

AI视频生产革命：拍我AI V5.5实现音画同步多镜头叙事，生成效率提升3倍

通义百聆语音双子星同步开源：3秒克隆声音，嘈杂环境识别率达93%

ChatGPT宣布将于8月8日凌晨1点发布GPT-5 三大版本模型规格首度曝光

暂无评论

最新文章

Qwen3.6-35B-A3B：小身材大能量的AI新星，智能体编程与多模态全能手

初识Qwen3.6-35B-A3B：小身材大能量的AI新星

核心能力：编程与视觉双修的全能选手

如何体验与使用：从云端到本地的多种选择

Claude Opus 4.7正式发布：编程、金融、视觉全面进化，普通人也能用的AI助手

OpenAI图像生成新王者：GPT Image 2如何让AI绘图进入“实用时代”

相关文章

Skills实现“降维打击”：自然语言工作流如何终结低代码的“赛博绣花”

AI视频生产革命：拍我AI V5.5实现音画同步多镜头叙事，生成效率提升3倍

通义百聆语音双子星同步开源：3秒克隆声音，嘈杂环境识别率达93%

ChatGPT宣布将于8月8日凌晨1点发布GPT-5 三大版本模型规格首度曝光

暂无评论

最新文章

标签云