智谱AI发布新一代开源大模型GLM-4.7：编程能力登顶开源榜首，美学与推理同步跃升

摘要： 2025年12月23日，智谱AI正式上线并开源其新一代旗舰大语言模型GLM-4.7。该模型在编程、推理与智能体三大核心能力上实现系统性突破，尤其在编程领域表现突出，在Code Arena、SWE-bench等多项权威基准测试中取得开源模型最佳成绩，甚至部分超越GPT-5.2等闭源模型。同时，模型在“审美”能力上实现显著提升，前端与PPT生成质量接近专业设计标准。GLM-4.7现已通过BigModel.cn开放API，并同步集成至z.ai全栈开发环境，为冲刺“全球大模型第一股”的智谱AI提供了有力的技术证明。

一、编程能力全面领先，开源模型新标杆

智谱AI此次发布的GLM-4.7，将升级重点明确指向了“Coding”，旨在成为开发者的强力编程搭档。

智谱AI发布新一代开源大模型GLM-4.7：编程能力登顶开源榜首，美学与推理同步跃升

在多项国际公认的编程基准测试中，GLM-4.7交出了一份亮眼的成绩单：

在由全球百万用户参与盲测的Code Arena评测中，GLM-4.7位列开源第一、国产第一，综合得分超越GPT-5.2。
在衡量解决真实GitHub问题的SWE-bench-Verified测试中，GLM-4.7以73.8%的得分刷新开源纪录，相比前代GLM-4.6提升5.8个百分点。
在LiveCodeBench V6测试中取得84.9分，同样创下开源模型新高，并超过了Claude Sonnet 4.5。
在多语言编程任务（SWE-bench Multilingual）和终端任务（Terminal Bench 2.0）上，提升幅度分别达到12.9%和16.5%。

更关键的是，这些基准测试的领先优势转化为了真实的开发体验。根据官方数据，在对100个覆盖前端、后端及指令遵循的真实编程任务测试中，GLM-4.7在代码的稳定性与可交付性上相比前代有显著提升，能够更可靠地完成从需求理解到生成可运行代码的端到端闭环。技术团队透露，通过优化算法架构，模型在处理多步骤编程任务时展现出更强的逻辑连贯性。

二、 “思考”机制革新，复杂任务处理更智能

除了硬核的编码能力，GLM-4.7在模型“思考”方式上也进行了重要升级，引入了更精细化的推理控制机制，旨在让模型“聪明时更聪明，简单时更快”。

交错式思考 (Interleaved Thinking)：模型在每次响应和工具调用前都会进行思考，将复杂的分布推理串联起来，从而提升指令遵循和生成质量。
保留式思考 (Preserved Thinking)：这是针对长周期、复杂任务（如大型代码项目）的创新机制。模型能在多轮对话中自动保留所有思考模块，复用已有推理而非从头推导，这大幅减少了信息丢失和不一致性，实测在跨文件调用的系统开发场景中可使响应速度提升37%。
轮级思考 (Turn-level Thinking)：用户可以在同一会话内，按轮次灵活控制是否开启深度思考。对于简单查询可关闭以追求快速响应，面对复杂规划或调试时再开启以保证准确性，实现了效率与质量的动态平衡。

这些思考模式的增强也直接体现在工具调用能力上。在评估工具使用能力的τ²-Bench评测中，GLM-4.7获得87.4分的开源最高分；在网页浏览任务BrowseComp中，其得分也达到了67.5分。

三、不止于代码：美学设计与复杂推理能力双跃升

令人惊喜的是，GLM-4.7的升级并不仅限于功能性。许多早期体验者反馈，其“体感最大的是审美的提升”。

前端与文档生成美学升级：模型生成的网页代码在布局、配色与组件规范上更贴近现代专业设计标准，结构更干净，组件层级更清晰。在PPT生成方面，其16:9标准宽屏适配率从上一代的52%大幅跃升至91%，基本实现了“即开即用”，元素尺寸和排版合理性也有显著改善。
复杂推理能力大幅进步：在被誉为“人类终极考试”的HLE基准测试中，GLM-4.7在使用工具的情况下取得了42.8%的准确率，相比GLM-4.6提升41%，并超过了GPT-5.1。在AIME 2025、IMOAnswerBench等数学推理测试中，也保持了顶尖水平。

四、即刻可用，冲刺上市前的“技术证明”

GLM-4.7的发布，也被外界视为正冲刺港股IPO的智谱AI在上市前最重要的技术展示之一。目前，模型已全面对外开放：

API服务：通过BigModel.cn平台提供，GLM Coding Plan已同步更新。
在线体验：集成在z.ai全栈开发模式的Skills模块中，支持多模态任务的统一规划与协同执行。
开源代码：模型权重与相关代码已在GitHub和Hugging Face等平台开源。

随着TRAE、Cerebras等平台确认集成，GLM-4.7有望在更广阔的开发者生态中快速落地，进一步巩固智谱AI在开源大模型领域的领先地位。

文章来源：综合自证券日报网、CNMO、CSDN博客、IT之家、品玩、ITBear科技资讯、网易订阅、东方财富网等报道。

Ai资讯 # GLM-4.7 # 智谱AI

文章版权归作者所有，未经允许请勿转载。

Sakana AI 发布 Fugu Ultra：多智能体编排系统对标 Fable 5，重新定义 AI 调用范式

智谱AI发布新一代开源大模型GLM-4.7：编程能力登顶开源榜首，美学与推理同步跃升

一、编程能力全面领先，开源模型新标杆

二、 “思考”机制革新，复杂任务处理更智能

三、不止于代码：美学设计与复杂推理能力双跃升

四、即刻可用，冲刺上市前的“技术证明”

千问AI硬件生态再落关键一子：夸克AI眼镜G1系列1999元起售，加速AI助手普及

国产AI编程新标杆：智谱GLM-4.7发布，性能与性价比双重“突围”

相关文章

Sakana AI 发布 Fugu Ultra：多智能体编排系统对标 Fable 5，重新定义 AI 调用范式

OpenAI Codex 「超级矩阵」曝光：跨设备控制打破锁屏限制，全域算力连成一台超级电脑！

Claude大举进军法律界！Anthropic发布20+款MCP连接器与专属插件，AI正覆盖律所85%业务流

谷歌发布“多模态杀手”Gemini Embedding 2：一个向量空间，通吃文本、图像、视频、音频、PDF

暂无评论

最新文章

智谱AI发布新一代开源大模型GLM-4.7：编程能力登顶开源榜首，美学与推理同步跃升

一、 编程能力全面领先，开源模型新标杆

二、 “思考”机制革新，复杂任务处理更智能

三、 不止于代码：美学设计与复杂推理能力双跃升

四、 即刻可用，冲刺上市前的“技术证明”

千问AI硬件生态再落关键一子：夸克AI眼镜G1系列1999元起售，加速AI助手普及

国产AI编程新标杆：智谱GLM-4.7发布，性能与性价比双重“突围”

相关文章

Sakana AI 发布 Fugu Ultra：多智能体编排系统对标 Fable 5，重新定义 AI 调用范式

OpenAI Codex 「超级矩阵」曝光：跨设备控制打破锁屏限制，全域算力连成一台超级电脑！

Claude大举进军法律界！Anthropic发布20+款MCP连接器与专属插件，AI正覆盖律所85%业务流

谷歌发布“多模态杀手”Gemini Embedding 2：一个向量空间，通吃文本、图像、视频、音频、PDF

暂无评论

最新文章

标签云

一、编程能力全面领先，开源模型新标杆

三、不止于代码：美学设计与复杂推理能力双跃升

四、即刻可用，冲刺上市前的“技术证明”