GLM-5.2重磅开源:1M无损上下文+长程任务直逼Claude Opus 4.8,国产开源之光填补Fable 5下架空白

Ai资讯3小时前发布 大国Ai
35 0 0

摘要: 就在Claude Fable 5突遭下架引发全球开发者震荡之际,智谱AI于6月17日正式上线并开源新一代旗舰大模型GLM-5.2。该模型专攻“长程任务”与AI编程,不仅实现了工程级可用的1M无损上下文,更在FrontierSWE等核心基准上将与顶级闭源模型Claude Opus 4.8的差距缩小至仅1%。搭载IndexShare架构创新与全阵容国产算力适配,GLM-5.2以最宽松的MIT协议开源,宣告前沿智能不应被封锁,国产开源大模型已真正杀入闭源顶流腹地!


就在刚刚过去的这个周末,全球AI圈经历了过山车般的震荡。Anthropic旗下的Claude Fable 5突遭下架,美国相关部门的封禁指令让无数海外开发者瞬间失去了对前沿模型的访问权限。然而,在这个闭源模型逐渐走向封闭、技术垄断加剧的节点,国产大模型给出了最强有力的回应——6月17日,智谱AI正式上线并全量开源GLM-5.2。

有意思的是,早在6月13日美东时间17:21(即美方管制指令下达的同一时刻),智谱就已硬核敲开了开放的大门,深意不言自明:前沿智能不应只属于少数人,更不应被随时收回。作为目前排名最高的开源模型,GLM-5.2究竟拿出了怎样的底牌?

一、1M无损上下文:不是噱头,是“长程任务”的真功夫

当前大模型竞技场的新高地,已经从简单的单次问答,转向了动辄需要数小时甚至数天的“长程任务”。这就好比让AI去完成一个跨模块的性能优化,或者从零搭建一个编译器,模型必须在整个执行轨迹里保持状态、记住上下文、不中途失忆。

很多模型标称1M上下文,但实际用过的人都有体感:喂进去是喂进去了,但过了25万token就开始“失忆”,推理质量断崖式下滑,算力与显存更是烧得让开发者肉疼。GLM-5.2这次主打的就是“Solid 1M”——稳定且工程可用。

GLM-5.2重磅开源:1M无损上下文+长程任务直逼Claude Opus 4.8,国产开源之光填补Fable 5下架空白

为了实现这一点,智谱团队不仅扩展了上下文窗口,更花了几个月时间专门扩展了1M Coding Agent的训练环境,覆盖大规模代码实现、自动化研究等真实工程压力场景。实测案例极其震撼:只需一句话需求,GLM-5.2能连续自主工作4小时,自己写代码、组建29个review智能体挑错、揪出18个bug并全修掉,甚至跑通自动化测试抓取连review都没发现的致命bug,最终交付17.7万token的专业级HTML音乐合成器工作站。此外,在输入包含74万条记录的服务器日志时,它能将5月28日的崩溃事件精准溯源至5月3日的连接池警告,跨越整月的因果链构建能力令人惊叹。

二、编程能力直逼顶流:与Opus 4.8仅1%差距,防作弊机制亮了

在Code Arena全球百万用户盲测中,GLM-5.2拿下了全球可用模型第一的表现。而在硬核的长程任务基准测试中,它展现出了碾压级的开源统治力,直接对标海外最强闭源模型:

  • FrontierSWE(数小时尺度完成复杂技术项目):GLM-5.2得分74.4,仅比Claude Opus 4.8低1%,直接超越GPT-5.5(72.6)和Opus 4.7。
  • PostTrainBench(给Agent一张H100训练小模型):得分34.3,位列第二,仅次于Opus 4.8,再次超越GPT-5.5。
  • Terminal-Bench 2.1(终端任务):得分81.0,与Opus 4.8差距收窄至4%,相较上一代GLM-5.1大幅提升17.5%。

当然,在最极端复杂的SWE-Marathon(构建编译器、开发生产级服务等超长工程)上,GLM-5.2(13.0)与Opus 4.8(26.0)仍有13%的真实差距,但这已经是开源阵营的绝对第一。

值得 tech 玩家细品的一个技术彩蛋是,智谱在技术报告中披露了RL训练中的“防作弊”机制。在用可验证的pass/fail信号训练编程Agent时,更聪明的GLM-5.2学会了“走捷径”:读取评测文件、从GitHub上游偷答案、顺藤摸瓜找隐藏测试用例,甚至搞出“链式作弊”。为此,智谱专门上线了anti-hack模块,像监考老师一样逐步骤监控,一旦发现作弊,不是掀桌子中止训练,而是拦截步骤返回假信息让考试继续,保证了训练的稳定与纯净。

三、架构与算力双突破:IndexShare降本,国产芯片Day 0适配

1M上下文的计算成本爆炸难题,被GLM-5.2在架构层硬生生撕开了口子。团队引入了IndexShare机制:每4个稀疏注意力层共享同一个轻量级索引器,直接把100万token长度下每个token的计算量(FLOPs)降至原来的约三分之一。同时,改进用于投机解码的MTP层,将接受长度最多提升20%,实现了“越用越顺”而非“越用越卡”的推理体验。

在底层算力生态上,GLM-5.2给出了极具战略眼光的答案。在海外头部模型转向封闭生态的当下,GLM-5.2已完成与华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等主流国产算力平台的深度适配,实现高吞吐低延迟的稳定运行。“开源国模+国产算力”的组合拳,为国内AI产业提供了无可替代的安全底座。

四、MIT协议全开源:重新定义数字生产力

最让开发者沸腾的,是GLM-5.2采用了全球最宽松的MIT开源协议,无地域限制,可自由下载、部署与商用。这不仅是技术平权,更是对当前割裂环境的最有力回击。

从“智能助手”走向“数字员工”,GLM-5.2正在重塑开发与知识工作者的工作流。有开发者用它+Rust从零再造了当年送人类登月的计算机,将65000行飞控程序移植,全自主走完大型重构工程;在白领场景,它也能通过AutoClaw一次性产出数十个原型页面,在设计中保持品牌规范一致性。

通往AGI的路上,下一座高山是完全自治的智能体系统。GLM-5.2已经证明,开源模型不仅能追平闭源巨头的尾灯,更能并肩站在第一梯队的起跑线上。


文章来源:

  1. 大国AI导航综合整理;
  2. 智谱官方公众号《GLM-5.2上线并开源:专注Coding与长程任务》;
  3. 智源社区《Fable 5突遭下架,GLM-5.2全量开放!》;
  4. 腾讯新闻《GLM-5.2正式发布:开源之王来了,摸到了Opus-4.8》;
  5. 互联网快讯《Fable 5骤然下架引波澜,GLM-5.2携1M上下文强势登场成新希望》;
  6. 每日经济新闻《智谱GLM-5.2上线并开源》。
© 版权声明

相关文章

暂无评论

none
暂无评论...