硅基流动平台正式上线GLM-4.7高速版,国产大模型编程能力再登新高峰

Ai资讯2天前发布 大国Ai
34 0 0

摘要: 2025年12月26日,AI云服务平台“硅基流动”正式上线智谱新一代旗舰大模型GLM-4.7的高速版本。该模型凭借在Code Arena全球编码盲测中斩获“开源第一、国产第一”并超越GPT-5.2的顶尖表现,以及在前端审美、任务规划和工具调用能力的全面跃升,为开发者提供了一个兼具深度思考与高效执行能力的强大编程伙伴。


一、性能登顶:从“代码生成”到“任务交付”的质变

GLM-4.7的发布标志着国产大模型在硬核技术领域的一次有力证明。其最核心的突破在于编程能力的实质性飞跃,已从生成简单代码片��,进化为能够以“任务交付”为核心进行全流程思考的智能体。

硅基流动平台正式上线GLM-4.7高速版,国产大模型编程能力再登新高峰

在权威评测中,GLM-4.7的成绩全面对标国际顶尖水平。它在全球百万开发者参与的Code Arena编码评估系统中,位列开源模型与国产模型双料冠军,综合性能超越了业界的标杆GPT-5.2。在更细致的基准测试中,其代码能力已对齐Claude Sonnet 4.5,在SWE-bench-Verified测试中获得73.8%的开源最佳成绩,在LiveCodeBench V6评测中取得84.9分,刷新了开源SOTA纪录。

二、技术内核:三大思考模式驱动智能认知升级

支撑其卓越表现的是GLM-4.7内部思考机制的深度优化。模型引入了三种可自由切换的思考模式,被形象地称为“智能认知变速箱”:

  1. 交错式思考:在每次回答或工具调用前进行思考,提升了复杂指令的遵循能力。
  2. 保留式思考:在多轮对话中自动保留历史思考块,避免重复推理,显著提升了长程、复杂任务中的一致性并节省计算成本。
  3. 轮级思考:允许开发者按“轮”控制推理开销,对简单查询追求快速响应,对复杂任务则开启深度思考,实现了效率与质量的动态平衡。

这套机制让GLM-4.7能够在Claude Code、TRAE、Kilo Code等多种编程框架中实现“先思考、再行动”,在复杂任务上表现出更强的稳定性。

三、能力全景:不止于代码,推理、审美与工具调用全面进化

GLM-4.7的升级是系统性的,在多个维度均实现重要突破:

  • 推理能力显著提升:在被誉为“人类最后的考试”的HLE基准测试中,GLM-4.7获得42.8%的成绩,较前代GLM-4.6提升41%,并超过了GPT-5.1。
  • 工具调用达到开源SOTA:在衡量智能体交互能力的τ²-Bench评测中,它以87.4分的成绩实现开源最佳,超越Claude Sonnet 4.5;在BrowseComp网页任务评测中也获得67.5分。
  • 前端审美与创作能力飞跃:其生成内容的美学质量大幅进步,能够生成观感更佳的网页、PPT和海报。例如,PPT的16:9适配率从52%跃升至91%,网页布局和配色更贴合设计规范。实测中,它能生成结构清晰、交互流畅的复杂前端应用,如可手势控制的3D圣诞树照片墙、仿iOS主界面以及双人对战小游戏。
  • 通用对话更富人情味:在聊天、写作与角色扮演等方面,回应也更为简洁智能且富有文采与沉浸感。

四、即刻体验:登陆硅基流动AI云,赋能真实开发场景

目前,兼具深度思考、审美在线与高效协作能力的GLM-4.7已成为硅基流动AI云平台上的第150位模型成员。该平台致力于成为开发者首选的“Token工厂”,提供多样、高速、稳定且经济的大模型API服务。

开发者现可通过硅基流动平台调用GLM-4.7,利用其支持的198K长上下文和缓存命中功能,在真实项目中体验其强大性能。新用户可获得赠金,免费体验平台包括DeepSeek、Qwen、Kimi、MiniMax在内的上百款热门模型。

此次GLM-4.7的上线,不仅是智谱在冲刺“全球大模型第一股”IPO前夕的关键技术展示,也象征着国产开源模型正从“对标国际”全面迈向“领跑与实用”的新阶段。它正为全球开发者提供一套强大且易用的生产力工具,推动编码辅助、AI科学研究等多个领域的创新发展。


文章来源:本文信息综合自硅基流动官方公告、智谱AI技术报告及《科创板日报》、《晚点LatePost》、量子位等多家媒体报道。

© 版权声明

相关文章

暂无评论

none
暂无评论...