GLM-4.7登顶开源编程模型榜首:国产大模型在WebDev竞技场实现关键超越

Ai资讯2天前发布 大国Ai
42 0 0

摘要:智谱AI于2025年12月23日正式发布并开源其新一代旗舰模型GLM-4.7。最新的大模型竞技场(WebDev)评测数据显示,GLM-4.7在总榜中位列第六,并成功登顶开源模型榜首,其编程能力超越了Claude-Sonnet-4.5与GPT-5等国际顶尖闭源模型。相较于前代GLM-4.6,其综合评分大幅提升了83个基准点,标志着国产大模型在代码生成与智能体任务处理能力上取得了里程碑式的突破。


2025年末,中国AI领域迎来一枚重磅“技术炸弹”。智谱AI在冲刺“全球大模型第一股”的IPO前夜,正式推出了GLM-4.7模型,并宣布开源。此次发布并非简单的版本迭代,而是一次在核心生产力场景——编程能力上的全面跃迁。根据面向全球开发者的权威编码盲测系统Code Arena的最新榜单,GLM-4.7在Web开发方向一举夺得开源模型第一、国产模型第一的宝座,其表现甚至超过了GPT-5.2与Claude Sonnet 4.5,成功跻身全球第一梯队。

技术突破:从“写代码”到“交付任务”的进化

GLM-4.7的飞跃并非空穴来风,其背后是一系列扎实的技术升级。官方基准测试结果显示,该模型在多项关键评测中表现亮眼:在SWE-bench-Verified测试中获得73.8%的成绩,位列开源第一;在LiveCodeBench V6评测中取得84.9分,刷新了开源SOTA纪录;在更考验复杂逻辑的HLE(“人类最后的考试”)基准测试中,成绩达到42.8%,较GLM-4.6提升41%,并超过了GPT-5.1。

GLM-4.7登顶开源编程模型榜首:国产大模型在WebDev竞技场实现关键超越

这些分数的提升,直接转化为了开发者手中实实在在的效率。GLM-4.7强化了其“思考能力”,引入了交错式思考、保留式思考与轮级思考三种模式。这意味着模型在处理复杂指令前会先进行逻辑推演,在多轮对话中能保留思考过程以保持一致性,开发者还可以根据任务复杂度灵活开关“思考”功能,在速度与稳定性间取得平衡。这种设计使其在Claude Code、TRAE等主流编程环境中,能够更稳定地执行“先思考、再行动”的机制,一次性给出完整、可运行的代码方案,并明确关键依赖,显著降低了人工调试成本。

实战体验:审美与智能体能力的双重惊喜

除了冰冷的分数,GLM-4.7在实际应用中的表现更令开发者社区感到兴奋。在对100个真实编程任务的测试中,GLM-4.7在前端任务上相较GLM-4.6的胜率提升至64.6%,在指令遵循场景中也达到58.3%。

尤为值得一提的是其在前端审美上的巨大进步。以往AI生成的网页或PPT常常被诟病“缺乏设计感”,而GLM-4.7增强了对UI设计规范的理解。在实际测试中,它生成的PPT 16:9适配率从52%跃升至91%,海报的排版与配色也更加灵活和专业,基本达到了“即开即用”的水平。有开发者体验后反馈,它能生成观感更佳的网页,在布局结构、配色和谐度上提供了更具美感的默认方案,减少了大量样式“微调”的时间。

此外,GLM-4.7的智能体(Agent)能力也实现了关键突破。在衡量智能体协作水平的τ²-Bench交互式工具调用评测中,它以87.4分的成绩实现了开源SOTA,超越了Claude Sonnet 4.5。这意味着它不仅能写代码,还能更高效地操作终端、读取网页、整合不同技术栈。通过z.ai平台全新的Skills模块,GLM-4.7可以统一调度视觉、语音等多模态能力,规划并执行复杂的自动化任务,真正打通了从规划到落地的开发闭环。

开源与普惠:开发者社区的“价格屠夫”

在取得技术突破的同时,GLM-4.7延续了智谱的开源传统,模型已在GitHub、Hugging Face和魔搭社区同步上线。更引人注目的是其“普惠”的定价策略。GLM-4.7已成为GLM Coding Plan的默认模型,该计划提供多种订阅选项,每月最低仅需20元人民币即可获得相当于Claude Pro三倍的用量,被开发者社区称为“价格屠夫”。

这一策略无疑将加速其在实际开发场景中的普及。目前,GLM系列模型的付费API使用量已长期居于OpenRouter全球前十,开源代码在全球社区的下载量超过6000万次。GLM-4.7的发布,正标志着国产开源模型从“对标国际”迈向“领跑、实用”的新阶段。

结语

GLM-4.7的横空出世,不仅是智谱AI技术实力的集中展示,也为全球开发者提供了一个性能对齐世界顶尖水平、且更易获取的生产力工具。在编码能力上实现开源第一的超越,证明了国产大模型在解决高难度工程问题上的巨大潜力。随着模型的开源与推广,一个由更强大、更易用的AI编程助手所驱动的开发新时代,或许正在到来。

文章来源:本文综合自北京市发展和改革委员会官网、阿里云开发者社区、东方财富网、CSDN博客、与非网等多家媒体及平台关于GLM-4.7的公开报道与评测信息。

© 版权声明

相关文章

暂无评论

none
暂无评论...