Agnes AI免费API实战:1M上下文+4K出图,全模态薅羊毛教程

Ai资讯3小时前发布 大国Ai
19 0 0

摘要:2026年6月1日,新加坡全球Top 10 AI Lab——Agnes AI宣布旗下文本、图片、视频三大模态API无限期免费开放,无需绑卡、不限时长。免费三周后单周Token消耗飙至4.29万亿,仅次于DeepSeek V4 Flash。近期又上线了百万Token上下文与4K超清出图两项重磅升级。本文将带你看懂Agnes AI免费政策的真实热度,拆解1M上下文与4K生图的技术价值,并分享一位独立开发者用Agnes API搭建”图片版番茄钟”的完整实战案例,最后解读Agnes透明化开发的社区运营逻辑。如果你是个人开发者、AI内容创作者,或正在寻找可零成本试错的多模态API底座,这篇不能错过。


一、Agnes AI免费政策:从0到4.29万亿Token只用三周

6月1日,Agnes AI(母公司为新加坡Sapiens AI)抛出一枚行业炸弹:旗下文本模型Agnes-2.0-Flash、图像模型Agnes-Image-2.1-Flash、视频模型Agnes-Video-V2.0,三大核心全模态API无限期免费开放,全程无需绑定信用卡。

这不是限时试用,也不是额度送完即止,而是真正意义上的”无限免费”。免费首周,全模态Token消耗就突破1万亿;到第三周,官方公布的周数据已经飙到4.29万亿,其中文本模型贡献2.68T,图片与视频模型合计1.61T,单周生成567万张图片、237万秒视频。

Agnes AI免费API实战:1M上下文+4K出图,全模态薅羊毛教程

4.29万亿Token是什么概念?在OpenRouter的模型周调用排行榜里,这个量级已经超过小米MiMo-V2.5,仅次于DeepSeek V4 Flash,跻身全球第一梯队。

在高盛预测”未来几年Token使用量将增长24倍以上”、英伟达副总裁直言”AI成本已超过团队薪资”的背景下,Agnes AI的免费策略直接打破了行业”按Token计费”的惯例。它真正解锁的,不是省下的那点钱,而是那些你以前因为太贵、不敢试而压根没动手的念头。


二、Agnes AI是什么来头:全球Top 10不是嘴上说说

很多人看到”免费”两个字就会质疑:是不是模型不行才免费?这其实是个误区。

Agnes AI的创始人是Bruce Yang,15岁拿到新加坡政府奖学金入读莱佛士书院,后赴UC Berkeley攻读计算机科学与应用数学双学位,师从图灵奖得主Richard Karp与David Patterson,毕业后在LinkedIn和微软工作,后回新加坡国立大学攻读AI方向博士,2025年初联合创立Agnes AI。

团队目前在文本、图片、视频三个模态上均排进全球模型榜单前十的Lab,海外只有谷歌和OpenAI,国内可能是阿里、字节,能做到三模态全覆盖的并不多。具体榜单成绩包括:

  • 文本模型Agnes-2.0-Flash:进入Claw-Eval榜单,Claw-Eval测的不是数学代码刷题,而是真实Agent场景中的任务规划、工具调用、多步骤执行能力,全球排名第8。
  • 图像模型Agnes-Image-2.0-Flash:进入Artificial Analysis图像编辑排行榜(Image Editing Leaderboard),该榜单采用真实用户盲评机制。
  • 视频模型Agnes-Video-V2.0:进入Artificial Analysis Image-to-Video(With Audio)排行榜,原生支持音画同步生成。

Bruce Yang的原话是:”我们的模型能提供顶级AI大约90%的能力,成本只有十分之一。” 而现在,连这十分之一的成本也直接归零了。


三、两大重磅升级:百万Token上下文+4K超清出图

6月中旬,Agnes在免费基础上又加了两件大件,并且全部纳入免费权益。

1. Agnes-2.0-Flash:1M原生超长上下文

Agnes-2.0-Flash正式支持100万Token上下文窗口,目前已灰度覆盖50%用户,高峰时段为保证服务稳定可能会限制在512K。

百万Token是什么概念?大约就是一整本长篇小说、几十份法律合同、一套大型技术手册和文档、一个中型项目的完整源码,可以一次性全塞进去。

技术底座上,Agnes采用自研的Recurrent Depth Transformer架构,通过循环复用Transformer层的计算单元,不增加参数和网络深度,PPL降低10%,单位参数算力利用率同步提升10%。同时配合稀疏注意力机制,1M上下文规模下单Token计算量只有传统全注意力模型的约1/20,并使用PagedAttention分页缓存将显存利用率从50%拉到90%。

实测中,有开发者把Dasgupta版(337页)和Jeff Erickson版(472页)两本经典算法教材共809页一次投喂,Agnes-2.0-Flash能直接输出对比总结表格、精确定位131页表格数据、跨章节综合问答全答对,”大海捞针”测试也成功找出隐藏的密码”pineapple pizza”。

而在几个月前,想用百万上下文模型还得花上百美金买会员等灰度——现在它成了Agnes免费API的标配。

2. Agnes-Image-2.1-Flash:4K超清生图

Agnes-Image-2.1-Flash全量解锁4K超高清生图能力,最高支持4096×4096分辨率,覆盖1:1、16:9、9:16、4:3、3:4等八种主流宽高比,1K/2K/3K/4K四档可选。

使用上只需改一个参数:把"size": "1K"换成"size": "4K"即可,代码无需重写:

{
  "model": "agnes-image-2.1-flash",
  "prompt": "一只在冰面上滑行的小熊,科普海报风格",
  "size": "4K",
  "ratio": "1:1"
}

对电商主图、广告素材、设计海报这类对清晰度有硬性需求的场景,4K在纹理还原和细节表现上有大幅提升。以金毛猎犬为例,4K版本能看清胸口每一缕毛发的走向、卷曲和光泽。

需要注意两点:一是4K生成时间较长,官方对免费RPM做了合理限制,4K图片每分钟只能请求一次;二是4K与1K价格一样——都是免费。


四、实战案例:用Agnes API搭建图片版番茄钟

Agnes的API完全兼容OpenAI协议,Cursor、Claude Code、Hermes、OpenClaw、Codex、Workbuddy等所有支持自定义endpoint的Agent框架,都能直接接上零成本开薅。

一位独立开发者就顺手用Agnes做了个”图片版番茄钟”,集成到自己的开源桌面小精灵Peeky里。

1. 痛点与灵感

作者自述”一不小心就会沉浸于vibe中长达三五小时”,传统番茄钟只是弹通知或响闹钟,体验过于枯燥。他想要的是:每隔一段时间,屏幕底部飘过一张风格随机的AI生成图片,温柔提醒你让眼睛和脑子休息一下。

2. 两步实现逻辑

实现上是经典的”文本模型生成prompt + 图像模型出图”两步走:

// 第一步:文本模型生成图片描述prompt
const promptResp = await client.chat.completions.create({
  model: "agnes-2.0-flash",
  messages: [{
    role: "user",
    content: `生成一段英文图片描述,主题:${style},用于提醒休息`
  }]
});
const imagePrompt = promptResp.choices[0].message.content;

// 第二步:图像模型生成图片
const imageResp = await client.images.generate({
  model: "agnes-image-2.1-flash",
  prompt: imagePrompt,
  size: "1K",
  response_format: "b64_json"
});

每隔25分钟(可自定义),Peeky会基于context(当前时间、用户名,未来还会加入心情、截屏甚至摄像头拍照)+ 用户选择的风格,现场生成一段图片描述prompt,再调图片模型出图。

3. 可选风格

内置风格包括:可爱小动物、二次元动漫少女、宁静风景、治愈美食、萌宠(猫/狗),还有一个”自定义”选项,可以自己写提示词弄些更大胆的画面。

每次都不带重样——因为prompt是现场基于context生成的,风格会统一但内容各异。如果需要,也可以把size改成”4K”,让高清大图全屏填满屏幕。

4. 为什么敢这么玩

作者的核心判断很直接:”你永远不需要关心钱,因为免费;也不需要关心稳定性,因为官方有一帮人在保障护航。”

Peeky是MIT协议开源项目,地址:https://github.com/Johnixr/peeky


五、透明化开发:免费最怕”出了问题没人管”

对主打免费策略的API平台来说,开发者最大的担忧不是性能,而是”出了问题没人管”。Agnes选择把开发进度全部公开。

在官方GitHub Issues看板上,从TTFT偏慢、图片模型偶发503、Codex接入报400、OpenClaw集成网络连接错误,到视频对话语言不稳定、字幕模糊不可移除等所有用户反馈的大小问题,全在上面公开跟踪闭环处理。

开发看板还能直接看到功能排期和Bug修复进度,例如”Agnes 2.0 Flash 1M Context Rollout”和”Agnes Image 2.0/2.1 Flash 4K Rollout”都已标记为Done(已完成)。

这种透明化运营,让免费用户对持续迭代有了清晰预期,也降低了迁移风险。


六、Agnes AI怎么接入:3步白嫖教程

如果你也想薅这波羊毛,接入流程极其简单:

第1步:注册拿Key
访问 platform.agnes-ai.com,支持邮箱、GitHub、谷歌账号一键登录,进入API密钥页面创建Key并复制保存,全程无需绑卡。

第2步:接入你的工具

  • Base URL:https://apihub.agnes-ai.com/v1
  • 认证方式:Bearer Token
  • 兼容协议:OpenAI兼容
    完全兼容OpenAI格式,改个地址就能用。

第3步:开始用
ChatGPT客户端、Cursor、Claude Code、Codex、OpenClaw、Hermes、Workbuddy等都能接,换一行Base URL就行,零迁移成本。

如果你嫌手动改配置麻烦,还可以用CC Switch这款开源跨平台桌面工具(GitHub Star超5万),统一管控Claude Code、Codex、GeminiCLI等主流编程AI的服务商配置,一键切换无需改代码。

已知小坑提醒

根据开发者实测,接入时需要注意以下几点:

  1. 文生图与图生图参数差异:纯文生图(agnes-image-2.1-flash)不支持extra_body.response_format参数,该参数仅用于图生图(agnes-image-2.0-flash)模式,传错会报UnsupportedParamsError。
  2. 视频URL字段名不一致:API响应中实际返回字段名是remixed_from_video_id,而非官方文档写的video_url,代码中建议做兼容处理:video_url = result.get("video_url") or result.get("remixed_from_video_id")
  3. 视频生成耗时:约2-3分钟生成3-5秒内容,需异步轮询(POST提交task_id,GET轮询至completed)。
  4. 并发限制:免费但有QPS和RPM限制,4K图片每分钟只能请求1次,文本模型每分钟可请求20次左右。

七、结语:免费时代的算力平权

Agnes AI这波操作的本质,是给中小开发者与独立创作者做了一次”算力平权”。当视觉类API长期被视为行业”奢侈品”,当Agent工作流一次对话背后要跑十几轮模型调用,免费政策直接解放了被成本压抑的创意生产需求。

Bruce Yang在采访中说得很直白:”我们想趁现在率先打出免费的旗帜,先上牌桌、先成为一个重要玩家。” 而对开发者来说,能在不被API成本束缚的前提下完成产品验证和Demo开发,本身就是巨大的价值。

百万上下文、4K出图、文本/图片/视频/语音合成(TTS灰度中)全模态、透明化开发、持续迭代升级——还全都免费。这样的羊毛,不用起来确实太浪费了。


文章来源:本文基于AGI Hunt《这家AI Lab宣布所有模型无限期免费后,我顺手做了个图片版番茄钟》及相关公开报道综合整理改写,参考了CSDN实测报告、极客公园创始人专访、今日头条、ChooseAI等多方资料。

相关链接

© 版权声明

相关文章

暂无评论

none
暂无评论...