2025年12月23日,中国人工智能领域迎来重磅消息。智谱AI正式发布并开源其新一代旗舰大模型GLM-4.7。该模型在编程能力上实现重大突破,在多项国际权威基准测试中,不仅位列开源模型第一,更在部分关键指标上超越了Claude Sonnet 4.5、GPT-5.2等国际闭源巨头,标志着国产大模型在核心能力上已达到全球顶尖水平。
GLM-4.7的发布并非一次常规迭代,而是在编码能力、长程任务规划与工具协同三个核心维度实现了“重要突破”。
1. 编程能力登顶开源榜首 根据官方发布的数据,GLM-4.7在编程领域的表现尤为亮眼。在权威的Code Arena全球编码评估系统中,该模型位列开源第一、国产第一,成绩超过了OpenAI的GPT-5.2。在更具挑战性的LiveCodeBench V6评测中,GLM-4.7取得了84.9分的优异成绩,不仅刷新了开源模型的纪录(SOTA),更成功超越了Anthropic的Claude Sonnet 4.5。此外,在衡量实际软件工程问题的SWE-bench-Verified测试中,GLM-4.7同样获得开源第一的成绩,相较上一代GLM-4.6提升5.8%。多项测试结果表明,其综合代码能力已可对标Claude Sonnet 4.5的水平。
2. 推理与数学能力大幅提升 除了顶尖的编程能力,GLM-4.7在复杂推理和数学解题方面也取得了长足进步。在HLE(Human Last Exam)基准测试中,GLM-4.7获得了42.8%的成绩,较GLM-4.6提升了41%,这一表现甚至超过了GPT-5.1。这表明模型在解决需要多步逻辑推理的复杂问题方面能力显著增强。
3. 智能体与工具调用能力增强 作为面向Agentic Coding(智能体编程)打造的模型,GLM-4.7的工具调用能力同样达到了开源领先水平。在BrowseComp网页任务评测中获得67.5分,在τ²-Bench交互式工具调用评测中更是以87.4分的成绩实现开源SOTA,超越Claude Sonnet 4.5。这意味着GLM-4.7在理解用户指令、规划任务步骤并调用外部工具(如浏览器、代码解释器)完成复杂操作方面表现更为出色。
GLM-4.7的进步不仅体现在基准测试分数上,更在于其底层机制的优化与应用能力的提升。
该模型进一步强化了“思考”能力,引入了交错式思考、保留式思考与轮级思考三种新模式。交错式思考让模型在每次回答或调用工具前进行深度思考,以提升对复杂指令的遵循能力;保留式思考则能在多轮对话中自动保留关键的思考过程,提升效率;轮级思考则支持按对话轮次灵活控制推理资源,实现简单任务与复杂任务的差异化处理。这些机制使得模型在处理长程、复杂任务时更加稳定和高效。
在前端与内容生成方面,GLM-4.7的质量也明显进步。它能够生成观感更佳的网页、PPT和海报。在办公创作场景中,其生成的PPT对16:9屏幕的适配率从52%大幅跃升至91%,海报设计的排版与配色也更加灵活和专业。
GLM-4.7的卓越性能,建立在智谱AI日益成熟的商业化与生态基础之上。此次发布正值智谱AI冲刺“全球大模型第一股”的关键时期。根据其招股书及相关市场信息,智谱已进入产业化落地快车道。
强劲的商业化表现:智谱AI的商业化收入增长迅猛。据报道,2024年其商业化收入增长超过100%,其MaaS(模型即服务)开放平台的API年收入同比增长超过30倍。该平台已吸引了超过70万企业和开发者用户,日均调用量达到600亿Tokens,过去4个月API每日消费量增长了90倍以上。在消费者市场,其旗舰应用“智谱清言”App拥有超过2500万用户,年化收入超千万。
深度的产业合作:智谱AI积极与地方政府及产业资本合作,推动技术落地。2025年3月,智谱完成了超10亿元人民币的战略融资,投资方包括杭州城投产业基金、上城资本等,旨在推动GLM大模型的技术创新和生态发展。此后,智谱与杭州、珠海、四川等地达成战略合作,累计获得地方国资投资超18亿元,共同开发面向政务、金融、医疗等垂直领域的行业大模型。
繁荣的开源生态:智谱一直致力于开源建设。公司此前宣布2025年为“开源年”,承诺将发布包括基座、推理、多模态、Agent在内的全新大模型并全部开源。目前,智谱开源模型系列(如ChatGLM)的全球累计下载量已超过3000万,累计获得超15万GitHub星标。GLM-4.7同样遵循宽松的MIT协议开源,不限制商用,为开发者社区提供了强大的工具选择。
GLM-4.7的发布具有多重战略意义。
首先,它证明了国产大模型在核心能力上已达到国际一流水准。在编程这一关键且高难度的赛道上,开源模型首次在多项基准上实现对顶尖闭源模型的超越,这极大地提振了行业信心。
其次,它展示了“开源驱动进步”的强大力量。正如业内观察者所言,开源技术能够拓展技术边界,其最大的优点在于实现了技术的民主化,这是人类进步的根本驱动力之一。GLM-4.7以优异的性能和更具竞争力的价格(输入价格约为Claude Sonnet 4.5的五分之一),为全球开发者提供了新的高端选择。
最后,它标志着智谱AI“技术+商业”双轮驱动战略进入新阶段。在提交IPO辅导、获得多轮融资的同时,推出具有里程碑意义的技术产品,GLM-4.7成为了智谱冲击资本市场最有力的“技术注脚”。这不仅有助于其巩固在国内大模型“六小虎”中的领先地位,也使其在全球AI竞赛中占据了更有利的位置。
随着GLM-4.7的全面开源与上线,预计将吸引大量开发者与企业用户采用,进一步加速AI技术在编程辅助、智能体开发、垂直行业应用等领域的落地,推动中国人工智能生态向更深、更广处发展。
文章来源:综合自智谱AI官方发布、AGI Hunt公众号文章《智谱 GLM-4.7,Coding 开源第一,其他也很强》(2025年12月24日)及相关公开报道。