Agnes AI免费API实战：1M上下文+4K出图，全模态薅羊毛教程

摘要：2026年6月1日，新加坡全球Top 10 AI Lab——Agnes AI宣布旗下文本、图片、视频三大模态API无限期免费开放，无需绑卡、不限时长。免费三周后单周Token消耗飙至4.29万亿，仅次于DeepSeek V4 Flash。近期又上线了百万Token上下文与4K超清出图两项重磅升级。本文将带你看懂Agnes AI免费政策的真实热度，拆解1M上下文与4K生图的技术价值，并分享一位独立开发者用Agnes API搭建”图片版番茄钟”的完整实战案例，最后解读Agnes透明化开发的社区运营逻辑。如果你是个人开发者、AI内容创作者，或正在寻找可零成本试错的多模态API底座，这篇不能错过。

一、Agnes AI免费政策：从0到4.29万亿Token只用三周

6月1日，Agnes AI（母公司为新加坡Sapiens AI）抛出一枚行业炸弹：旗下文本模型Agnes-2.0-Flash、图像模型Agnes-Image-2.1-Flash、视频模型Agnes-Video-V2.0，三大核心全模态API无限期免费开放，全程无需绑定信用卡。

这不是限时试用，也不是额度送完即止，而是真正意义上的”无限免费”。免费首周，全模态Token消耗就突破1万亿；到第三周，官方公布的周数据已经飙到4.29万亿，其中文本模型贡献2.68T，图片与视频模型合计1.61T，单周生成567万张图片、237万秒视频。

4.29万亿Token是什么概念？在OpenRouter的模型周调用排行榜里，这个量级已经超过小米MiMo-V2.5，仅次于DeepSeek V4 Flash，跻身全球第一梯队。

在高盛预测”未来几年Token使用量将增长24倍以上”、英伟达副总裁直言”AI成本已超过团队薪资”的背景下，Agnes AI的免费策略直接打破了行业”按Token计费”的惯例。它真正解锁的，不是省下的那点钱，而是那些你以前因为太贵、不敢试而压根没动手的念头。

二、Agnes AI是什么来头：全球Top 10不是嘴上说说

很多人看到”免费”两个字就会质疑：是不是模型不行才免费？这其实是个误区。

Agnes AI的创始人是Bruce Yang，15岁拿到新加坡政府奖学金入读莱佛士书院，后赴UC Berkeley攻读计算机科学与应用数学双学位，师从图灵奖得主Richard Karp与David Patterson，毕业后在LinkedIn和微软工作，后回新加坡国立大学攻读AI方向博士，2025年初联合创立Agnes AI。

团队目前在文本、图片、视频三个模态上均排进全球模型榜单前十的Lab，海外只有谷歌和OpenAI，国内可能是阿里、字节，能做到三模态全覆盖的并不多。具体榜单成绩包括：

文本模型Agnes-2.0-Flash：进入Claw-Eval榜单，Claw-Eval测的不是数学代码刷题，而是真实Agent场景中的任务规划、工具调用、多步骤执行能力，全球排名第8。
图像模型Agnes-Image-2.0-Flash：进入Artificial Analysis图像编辑排行榜（Image Editing Leaderboard），该榜单采用真实用户盲评机制。
视频模型Agnes-Video-V2.0：进入Artificial Analysis Image-to-Video（With Audio）排行榜，原生支持音画同步生成。

Bruce Yang的原话是：”我们的模型能提供顶级AI大约90%的能力，成本只有十分之一。” 而现在，连这十分之一的成本也直接归零了。

三、两大重磅升级：百万Token上下文+4K超清出图

6月中旬，Agnes在免费基础上又加了两件大件，并且全部纳入免费权益。

1. Agnes-2.0-Flash：1M原生超长上下文

Agnes-2.0-Flash正式支持100万Token上下文窗口，目前已灰度覆盖50%用户，高峰时段为保证服务稳定可能会限制在512K。

百万Token是什么概念？大约就是一整本长篇小说、几十份法律合同、一套大型技术手册和文档、一个中型项目的完整源码，可以一次性全塞进去。

技术底座上，Agnes采用自研的Recurrent Depth Transformer架构，通过循环复用Transformer层的计算单元，不增加参数和网络深度，PPL降低10%，单位参数算力利用率同步提升10%。同时配合稀疏注意力机制，1M上下文规模下单Token计算量只有传统全注意力模型的约1/20，并使用PagedAttention分页缓存将显存利用率从50%拉到90%。

实测中，有开发者把Dasgupta版（337页）和Jeff Erickson版（472页）两本经典算法教材共809页一次投喂，Agnes-2.0-Flash能直接输出对比总结表格、精确定位131页表格数据、跨章节综合问答全答对，”大海捞针”测试也成功找出隐藏的密码”pineapple pizza”。

而在几个月前，想用百万上下文模型还得花上百美金买会员等灰度——现在它成了Agnes免费API的标配。

2. Agnes-Image-2.1-Flash：4K超清生图

Agnes-Image-2.1-Flash全量解锁4K超高清生图能力，最高支持4096×4096分辨率，覆盖1:1、16:9、9:16、4:3、3:4等八种主流宽高比，1K/2K/3K/4K四档可选。

使用上只需改一个参数：把"size": "1K"换成"size": "4K"即可，代码无需重写：

{
  "model": "agnes-image-2.1-flash",
  "prompt": "一只在冰面上滑行的小熊，科普海报风格",
  "size": "4K",
  "ratio": "1:1"
}

对电商主图、广告素材、设计海报这类对清晰度有硬性需求的场景，4K在纹理还原和细节表现上有大幅提升。以金毛猎犬为例，4K版本能看清胸口每一缕毛发的走向、卷曲和光泽。

需要注意两点：一是4K生成时间较长，官方对免费RPM做了合理限制，4K图片每分钟只能请求一次；二是4K与1K价格一样——都是免费。

四、实战案例：用Agnes API搭建图片版番茄钟

Agnes的API完全兼容OpenAI协议，Cursor、Claude Code、Hermes、OpenClaw、Codex、Workbuddy等所有支持自定义endpoint的Agent框架，都能直接接上零成本开薅。

一位独立开发者就顺手用Agnes做了个”图片版番茄钟”，集成到自己的开源桌面小精灵Peeky里。

1. 痛点与灵感

作者自述”一不小心就会沉浸于vibe中长达三五小时”，传统番茄钟只是弹通知或响闹钟，体验过于枯燥。他想要的是：每隔一段时间，屏幕底部飘过一张风格随机的AI生成图片，温柔提醒你让眼睛和脑子休息一下。

2. 两步实现逻辑

实现上是经典的”文本模型生成prompt + 图像模型出图”两步走：

// 第一步：文本模型生成图片描述prompt
const promptResp = await client.chat.completions.create({
  model: "agnes-2.0-flash",
  messages: [{
    role: "user",
    content: `生成一段英文图片描述，主题：${style}，用于提醒休息`
  }]
});
const imagePrompt = promptResp.choices[0].message.content;

// 第二步：图像模型生成图片
const imageResp = await client.images.generate({
  model: "agnes-image-2.1-flash",
  prompt: imagePrompt,
  size: "1K",
  response_format: "b64_json"
});

每隔25分钟（可自定义），Peeky会基于context（当前时间、用户名，未来还会加入心情、截屏甚至摄像头拍照）+ 用户选择的风格，现场生成一段图片描述prompt，再调图片模型出图。

3. 可选风格

内置风格包括：可爱小动物、二次元动漫少女、宁静风景、治愈美食、萌宠（猫/狗），还有一个”自定义”选项，可以自己写提示词弄些更大胆的画面。

每次都不带重样——因为prompt是现场基于context生成的，风格会统一但内容各异。如果需要，也可以把size改成”4K”，让高清大图全屏填满屏幕。

4. 为什么敢这么玩

作者的核心判断很直接：”你永远不需要关心钱，因为免费；也不需要关心稳定性，因为官方有一帮人在保障护航。”

Peeky是MIT协议开源项目，地址：https://github.com/Johnixr/peeky

五、透明化开发：免费最怕”出了问题没人管”

对主打免费策略的API平台来说，开发者最大的担忧不是性能，而是”出了问题没人管”。Agnes选择把开发进度全部公开。

在官方GitHub Issues看板上，从TTFT偏慢、图片模型偶发503、Codex接入报400、OpenClaw集成网络连接错误，到视频对话语言不稳定、字幕模糊不可移除等所有用户反馈的大小问题，全在上面公开跟踪闭环处理。

开发看板还能直接看到功能排期和Bug修复进度，例如”Agnes 2.0 Flash 1M Context Rollout”和”Agnes Image 2.0/2.1 Flash 4K Rollout”都已标记为Done（已完成）。

这种透明化运营，让免费用户对持续迭代有了清晰预期，也降低了迁移风险。

六、Agnes AI怎么接入：3步白嫖教程

如果你也想薅这波羊毛，接入流程极其简单：

第1步：注册拿Key
访问 platform.agnes-ai.com，支持邮箱、GitHub、谷歌账号一键登录，进入API密钥页面创建Key并复制保存，全程无需绑卡。

第2步：接入你的工具

Base URL：https://apihub.agnes-ai.com/v1
认证方式：Bearer Token
兼容协议：OpenAI兼容
完全兼容OpenAI格式，改个地址就能用。

第3步：开始用
ChatGPT客户端、Cursor、Claude Code、Codex、OpenClaw、Hermes、Workbuddy等都能接，换一行Base URL就行，零迁移成本。

如果你嫌手动改配置麻烦，还可以用CC Switch这款开源跨平台桌面工具（GitHub Star超5万），统一管控Claude Code、Codex、GeminiCLI等主流编程AI的服务商配置，一键切换无需改代码。

已知小坑提醒

根据开发者实测，接入时需要注意以下几点：

文生图与图生图参数差异：纯文生图（agnes-image-2.1-flash）不支持extra_body.response_format参数，该参数仅用于图生图（agnes-image-2.0-flash）模式，传错会报UnsupportedParamsError。
视频URL字段名不一致：API响应中实际返回字段名是remixed_from_video_id，而非官方文档写的video_url，代码中建议做兼容处理：video_url = result.get("video_url") or result.get("remixed_from_video_id")。
视频生成耗时：约2-3分钟生成3-5秒内容，需异步轮询（POST提交task_id，GET轮询至completed）。
并发限制：免费但有QPS和RPM限制，4K图片每分钟只能请求1次，文本模型每分钟可请求20次左右。

七、结语：免费时代的算力平权

Agnes AI这波操作的本质，是给中小开发者与独立创作者做了一次”算力平权”。当视觉类API长期被视为行业”奢侈品”，当Agent工作流一次对话背后要跑十几轮模型调用，免费政策直接解放了被成本压抑的创意生产需求。

Bruce Yang在采访中说得很直白：”我们想趁现在率先打出免费的旗帜，先上牌桌、先成为一个重要玩家。” 而对开发者来说，能在不被API成本束缚的前提下完成产品验证和Demo开发，本身就是巨大的价值。

百万上下文、4K出图、文本/图片/视频/语音合成（TTS灰度中）全模态、透明化开发、持续迭代升级——还全都免费。这样的羊毛，不用起来确实太浪费了。

文章来源：本文基于AGI Hunt《这家AI Lab宣布所有模型无限期免费后，我顺手做了个图片版番茄钟》及相关公开报道综合整理改写，参考了CSDN实测报告、极客公园创始人专访、今日头条、ChooseAI等多方资料。

相关链接：

Agnes官网：https://agnes-ai.com
API平台：https://platform.agnes-ai.com
GitHub Issues：https://github.com/AgnesAI-Labs/Agnes-AI/issues
开发进度看板：https://github.com/users/AgnesAI-Labs/projects/1
Peeky开源项目：https://github.com/Johnixr/peeky

文章版权归作者所有，未经允许请勿转载。

OpenAI官宣ChatGPT引入广告：免费与ChatGPT Go用户优先体验，商业化路径全面开启

Agnes AI免费API实战：1M上下文+4K出图，全模态薅羊毛教程

一、Agnes AI免费政策：从0到4.29万亿Token只用三周

二、Agnes AI是什么来头：全球Top 10不是嘴上说说