智谱AI发布新一代开源大模型GLM-4.7:编程能力登顶开源榜首,美学与推理同步跃升

Ai资讯1周前发布 大国Ai
187 0 0

摘要: 2025年12月23日,智谱AI正式上线并开源其新一代旗舰大语言模型GLM-4.7。该模型在编程、推理与智能体三大核心能力上实现系统性突破,尤其在编程领域表现突出,在Code Arena、SWE-bench等多项权威基准测试中取得开源模型最佳成绩,甚至部分超越GPT-5.2等闭源模型。同时,模型在“审美”能力上实现显著提升,前端与PPT生成质量接近专业设计标准。GLM-4.7现已通过BigModel.cn开放API,并同步集成至z.ai全栈开发环境,为冲刺“全球大模型第一股”的智谱AI提供了有力的技术证明。


一、 编程能力全面领先,开源模型新标杆

智谱AI此次发布的GLM-4.7,将升级重点明确指向了“Coding”,旨在成为开发者的强力编程搭档。

智谱AI发布新一代开源大模型GLM-4.7:编程能力登顶开源榜首,美学与推理同步跃升

在多项国际公认的编程基准测试中,GLM-4.7交出了一份亮眼的成绩单:

  • 在由全球百万用户参与盲测的Code Arena评测中,GLM-4.7位列开源第一、国产第一,综合得分超越GPT-5.2
  • 在衡量解决真实GitHub问题的SWE-bench-Verified测试中,GLM-4.7以73.8%的得分刷新开源纪录,相比前代GLM-4.6提升5.8个百分点。
  • 在LiveCodeBench V6测试中取得84.9分,同样创下开源模型新高,并超过了Claude Sonnet 4.5
  • 在多语言编程任务(SWE-bench Multilingual)和终端任务(Terminal Bench 2.0)上,提升幅度分别达到12.9%和16.5%。

更关键的是,这些基准测试的领先优势转化为了真实的开发体验。根据官方数据,在对100个覆盖前端、后端及指令遵循的真实编程任务测试中,GLM-4.7在代码的稳定性与可交付性上相比前代有显著提升,能够更可靠地完成从需求理解到生成可运行代码的端到端闭环。技术团队透露,通过优化算法架构,模型在处理多步骤编程任务时展现出更强的逻辑连贯性。

二、 “思考”机制革新,复杂任务处理更智能

除了硬核的编码能力,GLM-4.7在模型“思考”方式上也进行了重要升级,引入了更精细化的推理控制机制,旨在让模型“聪明时更聪明,简单时更快”。

  1. 交错式思考 (Interleaved Thinking):模型在每次响应和工具调用前都会进行思考,将复杂的分布推理串联起来,从而提升指令遵循和生成质量。
  2. 保留式思考 (Preserved Thinking):这是针对长周期、复杂任务(如大型代码项目)的创新机制。模型能在多轮对话中自动保留所有思考模块,复用已有推理而非从头推导,这大幅减少了信息丢失和不一致性,实测在跨文件调用的系统开发场景中可使响应速度提升37%。
  3. 轮级思考 (Turn-level Thinking):用户可以在同一会话内,按轮次灵活控制是否开启深度思考。对于简单查询可关闭以追求快速响应,面对复杂规划或调试时再开启以保证准确性,实现了效率与质量的动态平衡。

这些思考模式的增强也直接体现在工具调用能力上。在评估工具使用能力的τ²-Bench评测中,GLM-4.7获得87.4分的开源最高分;在网页浏览任务BrowseComp中,其得分也达到了67.5分。

三、 不止于代码:美学设计与复杂推理能力双跃升

令人惊喜的是,GLM-4.7的升级并不仅限于功能性。许多早期体验者反馈,其“体感最大的是审美的提升”。

  • 前端与文档生成美学升级:模型生成的网页代码在布局、配色与组件规范上更贴近现代专业设计标准,结构更干净,组件层级更清晰。在PPT生成方面,其16:9标准宽屏适配率从上一代的52%大幅跃升至91%,基本实现了“即开即用”,元素尺寸和排版合理性也有显著改善。
  • 复杂推理能力大幅进步:在被誉为“人类终极考试”的HLE基准测试中,GLM-4.7在使用工具的情况下取得了42.8%的准确率,相比GLM-4.6提升41%,并超过了GPT-5.1。在AIME 2025、IMOAnswerBench等数学推理测试中,也保持了顶尖水平。

四、 即刻可用,冲刺上市前的“技术证明”

GLM-4.7的发布,也被外界视为正冲刺港股IPO的智谱AI在上市前最重要的技术展示之一。目前,模型已全面对外开放:

  • API服务:通过BigModel.cn平台提供,GLM Coding Plan已同步更新。
  • 在线体验:集成在z.ai全栈开发模式的Skills模块中,支持多模态任务的统一规划与协同执行。
  • 开源代码:模型权重与相关代码已在GitHub和Hugging Face等平台开源。

随着TRAE、Cerebras等平台确认集成,GLM-4.7有望在更广阔的开发者生态中快速落地,进一步巩固智谱AI在开源大模型领域的领先地位。


文章来源:综合自证券日报网、CNMO、CSDN博客、IT之家、品玩、ITBear科技资讯、网易订阅、东方财富网等报道。

© 版权声明

相关文章

暂无评论

none
暂无评论...