12月12日消息,在AI智能体竞赛的关键节点,谷歌于今日凌晨先于OpenAI,连续发布三项重磅Agent技术更新,旨在巩固其在自动化深度研究领域的领先地位,并大幅降低开发与应用门槛。此次发布的核心是升级并开放其旗舰产品——Gemini Deep Research Agent,同时开源了全新的评估基准DeepSearchQA,并推出了旨在简化开发的Interactions API。谷歌宣称,其深度研究智能体在关键基准测试中已达到最先进水平(SOTA),且成本远低于主要竞争对手。
核心摘要:性能突破与成本优势
谷歌DeepMind产品经理Lukas Haas在社交平台X上公布的数据显示,新版Gemini Deep Research Agent在谷歌内部构建的全面基准测试集“Humanity’s Last Exam”(HLE)上取得了46.4% 的得分。在与网络研究能力直接相关的“BrowseComp”基准测试中,其表现与OpenAI的GPT-5 Pro相当,但关键优势在于成本——据称其价格仅为后者的十分之一左右。
Gemini Deep Research Agent并非全新概念,其早期版本已能展示出强大的自动化研究能力。例如,在今年4月的演示中,搭载Gemini 2.5 Pro的Deep Research能在5分钟内自动浏览339个网站,生成一篇长达46页、包含详细数据来源的纳米技术学术论文。它还能将复杂报告转化为10分钟播客,极大提升了信息消化效率。