摘要: 2025年12月23日,智谱AI正式上线并开源其新一代旗舰大语言模型GLM-4.7。该模型在编程、推理与智能体三大核心能力上实现系统性突破,尤其在编程领域表现突出,在Code Arena、SWE-bench等多项权威基准测试中取得开源模型最佳成绩,甚至部分超越GPT-5.2等闭源模型。同时,模型在“审美”能力上实现显著提升,前端与PPT生成质量接近专业设计标准。GLM-4.7现已通过BigModel.cn开放API,并同步集成至z.ai全栈开发环境,为冲刺“全球大模型第一股”的智谱AI提供了有力的技术证明。
智谱AI此次发布的GLM-4.7,将升级重点明确指向了“Coding”,旨在成为开发者的强力编程搭档。
在多项国际公认的编程基准测试中,GLM-4.7交出了一份亮眼的成绩单:
更关键的是,这些基准测试的领先优势转化为了真实的开发体验。根据官方数据,在对100个覆盖前端、后端及指令遵循的真实编程任务测试中,GLM-4.7在代码的稳定性与可交付性上相比前代有显著提升,能够更可靠地完成从需求理解到生成可运行代码的端到端闭环。技术团队透露,通过优化算法架构,模型在处理多步骤编程任务时展现出更强的逻辑连贯性。
除了硬核的编码能力,GLM-4.7在模型“思考”方式上也进行了重要升级,引入了更精细化的推理控制机制,旨在让模型“聪明时更聪明,简单时更快”。
这些思考模式的增强也直接体现在工具调用能力上。在评估工具使用能力的τ²-Bench评测中,GLM-4.7获得87.4分的开源最高分;在网页浏览任务BrowseComp中,其得分也达到了67.5分。
令人惊喜的是,GLM-4.7的升级并不仅限于功能性。许多早期体验者反馈,其“体感最大的是审美的提升”。
GLM-4.7的发布,也被外界视为正冲刺港股IPO的智谱AI在上市前最重要的技术展示之一。目前,模型已全面对外开放:
随着TRAE、Cerebras等平台确认集成,GLM-4.7有望在更广阔的开发者生态中快速落地,进一步巩固智谱AI在开源大模型领域的领先地位。
文章来源:综合自证券日报网、CNMO、CSDN博客、IT之家、品玩、ITBear科技资讯、网易订阅、东方财富网等报道。