摘要:2026年6月1日,新加坡全球Top 10 AI Lab——Agnes AI宣布旗下文本、图片、视频三大模态API无限期免费开放,无需绑卡、不限时长。免费三周后单周Token消耗飙至4.29万亿,仅次于DeepSeek V4 Flash。近期又上线了百万Token上下文与4K超清出图两项重磅升级。本文将带你看懂Agnes AI免费政策的真实热度,拆解1M上下文与4K生图的技术价值,并分享一位独立开发者用Agnes API搭建”图片版番茄钟”的完整实战案例,最后解读Agnes透明化开发的社区运营逻辑。如果你是个人开发者、AI内容创作者,或正在寻找可零成本试错的多模态API底座,这篇不能错过。
6月1日,Agnes AI(母公司为新加坡Sapiens AI)抛出一枚行业炸弹:旗下文本模型Agnes-2.0-Flash、图像模型Agnes-Image-2.1-Flash、视频模型Agnes-Video-V2.0,三大核心全模态API无限期免费开放,全程无需绑定信用卡。
这不是限时试用,也不是额度送完即止,而是真正意义上的”无限免费”。免费首周,全模态Token消耗就突破1万亿;到第三周,官方公布的周数据已经飙到4.29万亿,其中文本模型贡献2.68T,图片与视频模型合计1.61T,单周生成567万张图片、237万秒视频。
4.29万亿Token是什么概念?在OpenRouter的模型周调用排行榜里,这个量级已经超过小米MiMo-V2.5,仅次于DeepSeek V4 Flash,跻身全球第一梯队。
在高盛预测”未来几年Token使用量将增长24倍以上”、英伟达副总裁直言”AI成本已超过团队薪资”的背景下,Agnes AI的免费策略直接打破了行业”按Token计费”的惯例。它真正解锁的,不是省下的那点钱,而是那些你以前因为太贵、不敢试而压根没动手的念头。
很多人看到”免费”两个字就会质疑:是不是模型不行才免费?这其实是个误区。
Agnes AI的创始人是Bruce Yang,15岁拿到新加坡政府奖学金入读莱佛士书院,后赴UC Berkeley攻读计算机科学与应用数学双学位,师从图灵奖得主Richard Karp与David Patterson,毕业后在LinkedIn和微软工作,后回新加坡国立大学攻读AI方向博士,2025年初联合创立Agnes AI。
团队目前在文本、图片、视频三个模态上均排进全球模型榜单前十的Lab,海外只有谷歌和OpenAI,国内可能是阿里、字节,能做到三模态全覆盖的并不多。具体榜单成绩包括:
Bruce Yang的原话是:”我们的模型能提供顶级AI大约90%的能力,成本只有十分之一。” 而现在,连这十分之一的成本也直接归零了。
6月中旬,Agnes在免费基础上又加了两件大件,并且全部纳入免费权益。
Agnes-2.0-Flash正式支持100万Token上下文窗口,目前已灰度覆盖50%用户,高峰时段为保证服务稳定可能会限制在512K。
百万Token是什么概念?大约就是一整本长篇小说、几十份法律合同、一套大型技术手册和文档、一个中型项目的完整源码,可以一次性全塞进去。
技术底座上,Agnes采用自研的Recurrent Depth Transformer架构,通过循环复用Transformer层的计算单元,不增加参数和网络深度,PPL降低10%,单位参数算力利用率同步提升10%。同时配合稀疏注意力机制,1M上下文规模下单Token计算量只有传统全注意力模型的约1/20,并使用PagedAttention分页缓存将显存利用率从50%拉到90%。
实测中,有开发者把Dasgupta版(337页)和Jeff Erickson版(472页)两本经典算法教材共809页一次投喂,Agnes-2.0-Flash能直接输出对比总结表格、精确定位131页表格数据、跨章节综合问答全答对,”大海捞针”测试也成功找出隐藏的密码”pineapple pizza”。
而在几个月前,想用百万上下文模型还得花上百美金买会员等灰度——现在它成了Agnes免费API的标配。
Agnes-Image-2.1-Flash全量解锁4K超高清生图能力,最高支持4096×4096分辨率,覆盖1:1、16:9、9:16、4:3、3:4等八种主流宽高比,1K/2K/3K/4K四档可选。
使用上只需改一个参数:把"size": "1K"换成"size": "4K"即可,代码无需重写:
"size": "1K"
"size": "4K"
{ "model": "agnes-image-2.1-flash", "prompt": "一只在冰面上滑行的小熊,科普海报风格", "size": "4K", "ratio": "1:1" }
对电商主图、广告素材、设计海报这类对清晰度有硬性需求的场景,4K在纹理还原和细节表现上有大幅提升。以金毛猎犬为例,4K版本能看清胸口每一缕毛发的走向、卷曲和光泽。
需要注意两点:一是4K生成时间较长,官方对免费RPM做了合理限制,4K图片每分钟只能请求一次;二是4K与1K价格一样——都是免费。
Agnes的API完全兼容OpenAI协议,Cursor、Claude Code、Hermes、OpenClaw、Codex、Workbuddy等所有支持自定义endpoint的Agent框架,都能直接接上零成本开薅。
一位独立开发者就顺手用Agnes做了个”图片版番茄钟”,集成到自己的开源桌面小精灵Peeky里。
作者自述”一不小心就会沉浸于vibe中长达三五小时”,传统番茄钟只是弹通知或响闹钟,体验过于枯燥。他想要的是:每隔一段时间,屏幕底部飘过一张风格随机的AI生成图片,温柔提醒你让眼睛和脑子休息一下。
实现上是经典的”文本模型生成prompt + 图像模型出图”两步走:
// 第一步:文本模型生成图片描述prompt const promptResp = await client.chat.completions.create({ model: "agnes-2.0-flash", messages: [{ role: "user", content: `生成一段英文图片描述,主题:${style},用于提醒休息` }] }); const imagePrompt = promptResp.choices[0].message.content; // 第二步:图像模型生成图片 const imageResp = await client.images.generate({ model: "agnes-image-2.1-flash", prompt: imagePrompt, size: "1K", response_format: "b64_json" });
每隔25分钟(可自定义),Peeky会基于context(当前时间、用户名,未来还会加入心情、截屏甚至摄像头拍照)+ 用户选择的风格,现场生成一段图片描述prompt,再调图片模型出图。
内置风格包括:可爱小动物、二次元动漫少女、宁静风景、治愈美食、萌宠(猫/狗),还有一个”自定义”选项,可以自己写提示词弄些更大胆的画面。
每次都不带重样——因为prompt是现场基于context生成的,风格会统一但内容各异。如果需要,也可以把size改成”4K”,让高清大图全屏填满屏幕。
作者的核心判断很直接:”你永远不需要关心钱,因为免费;也不需要关心稳定性,因为官方有一帮人在保障护航。”
Peeky是MIT协议开源项目,地址:https://github.com/Johnixr/peeky
对主打免费策略的API平台来说,开发者最大的担忧不是性能,而是”出了问题没人管”。Agnes选择把开发进度全部公开。
在官方GitHub Issues看板上,从TTFT偏慢、图片模型偶发503、Codex接入报400、OpenClaw集成网络连接错误,到视频对话语言不稳定、字幕模糊不可移除等所有用户反馈的大小问题,全在上面公开跟踪闭环处理。
开发看板还能直接看到功能排期和Bug修复进度,例如”Agnes 2.0 Flash 1M Context Rollout”和”Agnes Image 2.0/2.1 Flash 4K Rollout”都已标记为Done(已完成)。
这种透明化运营,让免费用户对持续迭代有了清晰预期,也降低了迁移风险。
如果你也想薅这波羊毛,接入流程极其简单:
第1步:注册拿Key 访问 platform.agnes-ai.com,支持邮箱、GitHub、谷歌账号一键登录,进入API密钥页面创建Key并复制保存,全程无需绑卡。
第2步:接入你的工具
https://apihub.agnes-ai.com/v1
第3步:开始用 ChatGPT客户端、Cursor、Claude Code、Codex、OpenClaw、Hermes、Workbuddy等都能接,换一行Base URL就行,零迁移成本。
如果你嫌手动改配置麻烦,还可以用CC Switch这款开源跨平台桌面工具(GitHub Star超5万),统一管控Claude Code、Codex、GeminiCLI等主流编程AI的服务商配置,一键切换无需改代码。
根据开发者实测,接入时需要注意以下几点:
extra_body.response_format
remixed_from_video_id
video_url
video_url = result.get("video_url") or result.get("remixed_from_video_id")
Agnes AI这波操作的本质,是给中小开发者与独立创作者做了一次”算力平权”。当视觉类API长期被视为行业”奢侈品”,当Agent工作流一次对话背后要跑十几轮模型调用,免费政策直接解放了被成本压抑的创意生产需求。
Bruce Yang在采访中说得很直白:”我们想趁现在率先打出免费的旗帜,先上牌桌、先成为一个重要玩家。” 而对开发者来说,能在不被API成本束缚的前提下完成产品验证和Demo开发,本身就是巨大的价值。
百万上下文、4K出图、文本/图片/视频/语音合成(TTS灰度中)全模态、透明化开发、持续迭代升级——还全都免费。这样的羊毛,不用起来确实太浪费了。
文章来源:本文基于AGI Hunt《这家AI Lab宣布所有模型无限期免费后,我顺手做了个图片版番茄钟》及相关公开报道综合整理改写,参考了CSDN实测报告、极客公园创始人专访、今日头条、ChooseAI等多方资料。
相关链接: