Gemini 3.5 Flash的定位颇具颠覆性。尽管属于Flash系列,其在Agent核心基准测试上的表现却令人侧目:在MCP Atlas(多步骤工作流测试)上取得83.6%的SOTA成绩,超越了GPT-5.5和Claude Opus 4.7;在编程测试Terminal-Bench 2.1上得分76.2%,甚至反超自家上一代旗舰Gemini 3.1 Pro。
这揭示了一个趋势:专为速度设计的模型,在“干活”能力上已逼近甚至超越传统旗舰。其核心武器是极致的速度——289 tokens/秒的输出速度和65毫秒的首token延迟,约为其他前沿模型的4倍。定价上,它也极具攻击性,输入1.5美元/百万token,输出9美元/百万token,远低于Claude Opus 4.7等模型。