谷歌 2026震撼一夜:Gemini 3.5 Flash碾压前代旗舰,Omni重塑视频生成,Spark开启7x24h Agent时代

Ai资讯1小时前发布 大国Ai
19 0 0

摘要: 在刚刚落幕的谷歌I/O 2026大会上,谷歌放出连环大招,彻底重塑了AI行业的天花板。全新全模态大模型Gemini Omni实现任意输入生成物理规律正确的视频;Gemini 3.5 Flash以断层式优势碾压三个月前才登顶的旗舰3.1 Pro,甚至能在12小时内调用93个Agent从零写出操作系统并运行《毁灭战士》;全天候个人AI助手Gemini Spark则宣告了7×24小时云端替打工时代的到来。谷歌正以惊人的工程部署速度,将AI从“被动聊天”推向“主动干活”,甚至让人隐约看到了通向ASI(人工超级智能)的入口。


昨夜的谷歌I/O 2026,注定要在AI发展史上留下一道刺眼的分界线。

劈柴和DeepMind掌门人Hassabis同台,把憋了半年的大招一口气全砸在了桌子上。没有铺垫,没有寒暄,全都是足以让硅谷同行彻夜难眠的干货。

半年前,行业还在为Gemini 3.1 Pro在ARC-AGI-2测试中拿下77.1%的成绩、逼退Claude和GPT而惊叹;三个月前,Gemini 3刚刚完成对大模型竞争格局的洗牌。而今夜,那些曾经封神的旗舰模型,统统沦为了背景板。

Gemini Omni首发:告别物理崩坏,任意输入即可生视频

如果说Sora开启了AI视频的闸门,那Gemini Omni则直接把整个电影工业的底层逻辑掀翻了。

正如会前多方爆料所言,谷歌在本次大会上进一步加码了智能体AI与多模态的融合。Hassabis亲自登台揭晓了Gemini Omni——一个真正意义上的全能创作引擎。它不仅仅是“视频版Nano Banana”,更恐怖的是,它终于让AI视频摆脱了“重力失效、手指乱飘”的物理崩坏症。

谷歌 2026震撼一夜:Gemini 3.5 Flash碾压前代旗舰,Omni重塑视频生成,Spark开启7x24h Agent时代

Omni将Gemini的世界知识与强悍的推理能力直接注入了视频生成。给它一句“用粘土动画解释蛋白质折叠”,生成的画面里氨基酸链折叠成α螺旋和β折叠的每一步都严丝合缝,宛如顶级科教片;给它一段自拍视频,一句话就能让手掌上画的圈变成吞噬一切的黑洞,或者让傍晚的街道秒变赛博朋克风。

更绝的是,Omni支持多轮对话式剪辑。你可以先让它生成一段小提琴演奏,下一句让它“把小提琴手传送到雪山上”,再下一句“把镜头切到肩膀后方”。场景随意跳跃,但角色的演奏动作、光影、甚至音乐都连贯如初,没有任何崩坏。

图片、音频、视频、文字……任何组合都能扔进去作为参考,Omni能吐出一个完全遵循物理规律和语义逻辑的视频。目前,Omni Flash已在Gemini App、Google Flow和YouTube Shorts上线,YouTube Shorts用户甚至可以免费用。

Flash干翻Pro:93个Agent 12小时造出OS,跑起《毁灭战士》

如果说Omni是创意的狂欢,那Gemini 3.5 Flash就是纯粹的性能暴力美学。

就在几个月前,Gemini 3.1 Pro还因为在代码和推理领域的史诗级飞跃而被奉为新王。但昨晚,劈柴亲口宣布:3.5 Flash在几乎所有的基准测试中,全面碾压了自家的前代旗舰3.1 Pro!

Terminal-Bench 2.1(编码)76.2%、GDPval-AA(真实世界Agent任务)1656 Elo、MCP Atlas(大规模工具使用)83.6%……这哪里是换代,简直是断崖式降维打击。更不用说它289 tokens/秒的输出速度,比GPT-5.5和Opus 4.7快了4倍还不止。

但最让台下观众头皮发麻的,是一个极端演示:通过全新升级的Antigravity 2.0平台,3.5 Flash调度了93个子Agent并行工作。12个小时,处理26亿个token,从零开始写出了一个功能完整的操作系统内核!调度程序、内存管理、文件系统,全由Agent自主编写和审计。当Demo主持人在这个“AI写的系统”上成功跑起《毁灭战士》(DOOM)时,全场沸腾。

从早期的代码辅助,到去年作为“类IDE”产品初露锋芒,如今的Antigravity 2.0已经彻底蜕变为一个独立的桌面级Agent开发平台。子Agent可以动态生成、异步任务不再阻塞,甚至可以用/goal命令让Agent一口气跑到底。

Gemini Spark登场:7×24小时在线的云端打工替身

当其他家还在卷大模型问答时,谷歌直接甩出了杀手锏——Gemini Spark。

这不是一个陪你聊天的机器人,而是一个7×24小时住在云端虚拟机里的“个人特工”。即使你合上电脑,它依然在默默替你干活。

产品副总裁Josh Woodward在现场演示了什么是真正的“一句话办事”。工作场景中,一句“汇总上周Gemini Live的信息起草邮件”,Spark就自动跨Gmail、Docs抓取信息,还能调用用户自定义的“ghostwriter”技能,模仿你的口吻写邮件;生活场景中,让它“规划一场街区派对”,它直接建好Google Sheets追踪表,自动连接Gmail更新报名状态,甚至给没报名的邻居起草催促邮件,顺手还生成了一个带充气城堡信息的Slides宣传册。

更可怕的是它的并发理解能力。Woodward对着手机一口气甩出三个任务:“把跟Sundar的会议标成亮粉色”“给新邻居写邀请函”“列出到学期结束前为孩子要做的事并按日期排好”。Spark瞬间将一段语音拆解为三条线程,在后台齐头并进。

每月100美元的AI Ultra订阅即可使用Spark Beta版。可以说,Spark把谷歌“办公全家桶”的生态壁垒发挥到了极致。

这一夜,谷歌撕开了ASI入口

回看这场发布会,真正让人后脊发凉的,不是某一项跑分,而是谷歌在一夜之间补齐了最后的拼图:全模态理解、全模态生成、全天候在线Agent。

Omni不需要人类喂素材,一句话就能凭空创造一个符合物理规律的世界;Antigravity里的93个Agent不需要人类写一行代码,自己造出了操作系统;Spark不需要人类打开任何App,7×24小时替你打理一切。

当AI真正实现了自我理解、自我决策、自我执行和自我迭代时,那条路的终点只有一个——ASI(人工超级智能)。半年前,我们还在争论AGI是不是资本的泡沫;半年后,谷歌已经用Agent把键盘敲穿了。

通往超级智能的路上,已经没有“技术上做不到”的阻碍,剩下的,只是工程部署的加速度。而昨夜的谷歌,油门已经踩到了底。


文章来源:
综合自新智元、第一财经、谷歌官方博客及2026 Google I/O大会公开资料

© 版权声明

相关文章

暂无评论

none
暂无评论...