告别熬夜肝PPT!实测天工超级智能体:20分钟吐出Word+PPT+图表全套汇报,SkyClaw-v1.0太顶了

Ai资讯5小时前发布 大国Ai
49 0 0

摘要: 还在为读论文、肝报告、做PPT疯狂掉头发?国产AI又卷出新高度!昆仑万维旗下的天工超级智能体搭配最新自研Agent模型SkyClaw-v1.0,真正实现了“一句话交付一整套工作流”。丢给它几篇硬核PDF,20分钟内Word总结、商务PPT、数据图表、思维导图全给你安排明白;接上API,它甚至能自己写代码交付带交互的HTML网页。更狠的是,性能逼近Claude Opus 4.6,价格却不到同行一半,还开放了免费API!今天咱们就来扒一扒,这款号称“云端AI团队”的神器,到底能不能打。


打工人的苦,一半是KPI给的,另一半是汇报材料给的。

以前拿到几篇几十页的行业PDF,我的固定流程是:死磕读论文 -> 摘抄笔记 -> 码字写Word报告 -> 抠脑壳做PPT -> 还得手动画几张图表装点门面。这一套连招下来,半天时间算是交代了。哪怕现在用上了AI,也得在ChatGPT、Midjourney、办公软件之间反复横跳,提示词写到手酸,最后拼接出来的东西还常常像“弗兰肯斯坦的怪物”。

告别熬夜肝PPT!实测天工超级智能体:20分钟吐出Word+PPT+图表全套汇报,SkyClaw-v1.0太顶了

直到最近,我深度测评了天工超级智能体和它背后的自研模型SkyClaw-v1.0,我才确信,真正的AI办公自动化,根本不该是我们伺候AI,而是AI伺候我们。

告别工具拼接:一个对话框搞定全套产出

市面上不少AI助手,说到底还是“单线程”思维——你让它写报告,它就只给你吐文字;你让它画图,它就只给你出张图。但职场人的工作流是“多线程”的,我们需要的是一整套交付物。

天工超级智能体的逻辑完全不同。它构建了一个由“5个专家智能体”加上“1个通用智能体”组成的垂直专业系统。这5个专家分别死磕文档、PPT、表格、播客和网页,而通用智能体则接入了数十个MCP,搞定图片、音乐、视频等多模态需求。

我随手扔给它两篇关于“AI安全透明度与越狱机制”的硬核英文学术PDF,只下了一条指令:“请读取我上传的几篇PDF,输出Word文档报告、10页商务PPT、3个可视化图表和一张信息脑图。”

接下来就是见证魔法的时刻。它没有像传统大模型那样直接在对话框里长篇大论,而是在后台悄无声息地开启了“云电脑模式”。系统采用了分层多智能体协同机制,顶层规划智能体将我的复杂任务拆解为数据收集、行业建模、趋势预测、报告生成等十几个子任务,然后动态分配给底层专业智能体去执行。

大约20分钟后,工作台弹出了完整的产出物:

  • 一份17页的Word综合报告:逻辑严密,从研究概述到关键发现,再到机制分析,全给梳理清楚了。更绝的是,报告里自带条形图、折线图、雷达图等数据可视化图表,不用我再手动去Excel里拉。
  • 一份10页的商务PPT:排版专业,逻辑层级分明,连引用的对比图表都标得清清楚楚,自带动态效果。最爽的是内置了多模态编辑器,我可以直接在线对PPT的某个页面进行二次AI编辑或人工微调,顺手就能弄。
  • 一套可视化图表与脑图:基于论文内容生成的方向性消融效果图、余弦相似度图表,以及把两篇论文核心概念串联起来的思维导图,直接省了我用绘图工具抠细节的时间。

这哪里是AI聊天,这分明是雇了个不要睡觉的云端实习生团队!而这一切的底气,离不开它的核心技术——Deep Research(深度研究)能力。

Deep Research:让AI从“懂检索”变“懂研究”

为什么天工生成的报告能有“咨询级”的深度?因为它在文档、PPT、表格这“办公三件套”里,深度集成了自研的Deep Research能力。

现在的很多AI,你问它问题,它搜几个网页就敢胡编乱造。但天工的Deep Research模型,是基于模型深度思考和推理能力进行信息检索的,它懂得增加搜索的广度和宽度,并通过强化学习提升搜索能力的泛化性。这就好比你招了个助理,以前他只会百度复制粘贴,现在他懂得去各大数据库交叉验证、深度推演了。

实力怎么样,拿榜单说话最直接。在Meta和Huggingface联合推出的GAIA评测集上,天工的Deep Research Agent框架拿到了82.42的高分,直接登顶全球第一;在OpenAI推出的SimpleQA评测上也拿下了94.5分。有这样的底子,它才敢在分析学术论文、行业调研这种硬核任务上给你交出靠谱的答卷。

SkyClaw-v1.0:国产Agent模型的“卷王”

如果说天工超级智能体是光鲜亮丽的前台,那5月26日刚发布的高性能Agent模型SkyClaw-v1.0,就是那个在后台疯狂输出的核心引擎。

以前的大模型,核心逻辑是“问答”——你问我答,答完拉倒。但Agent模型要的是“执行”。SkyClaw-v1.0支持百万Token上下文,重点优化了复杂工具调用、多轮任务执行、代码生成、文件编辑等真实办公场景。它要做的,是在长上下文和工具环境中持续推进任务,而不是只生成一段漂亮但没用的废话。

从实测数据来看,SkyClaw-v1.0确实有点东西:

  1. 性能逼近海外大厂头部:在主流Agent benchmark测试中,它全面超越了Minimax 2.7、DeepSeek V4 Flash以及Qwen 3.6系列模型,表现甚至接近DeepSeek V4 Pro、Claude Opus 4.6这种更大规模的顶级模型。
  2. 极致性价比:这才是最扎心的。它的定价低于Minimax 2.7与Qwen 3.6系列模型的一半,让高性能Agent能力具备了规模化调用的基础。
  3. 为“交付”而生:它的训练重点就三件事——构建可交互的工具环境、筛选高质量任务轨迹、用强化学习提升多步执行稳定性。优化目标从“回答是否好看”转向了“任务是否完成、过程是否稳定”。

为了验证它是不是“纸上谈兵”,我直接把SkyClaw-v1.0接入了Claude Code,给它派了个硬茬任务:上传一份Excel,让它自己识别数据、挑字段,然后直接撸一个包含ECharts柱状图、折线图、饼图的完整HTML网页出来。

这活儿对模型的考验极高,得同时调度读文件、写代码、选图表、落HTML四件事,中间任何一步偷懒都会翻车。结果SkyClaw-v1.0自己拆解需求、起项目骨架,最后交付的网页不仅能跑,数据概览、图表、中文结论一应俱全,美观度甚至不输给同任务下跑出来的Gemini-3.5-Flash。但别忘了,SkyClaw的成本可是实打实地低了一截。

AI办公进入“白嫖”时代?

以前总觉得用海外顶级模型跑复杂Agent是“土豪专属”,每一次工具调用都在烧钱。但现在,SkyClaw-v1.0的发布直接把门槛踩碎了。

目前,SkyClaw-v1.0已经接入了天工Skywork平台,用户可以直接免费试用,而且面向开发者开放了免费API调用权限(注册API Free账号即可获取密钥)。接口完全兼容OpenAI格式,支持流式输出、工具调用、多轮对话,你甚至可以通过飞书等移动端直接遥控它干活——在地铁上发个指令,到公司就能直接从云端拉取做好的报告,这种体验堪称魔幻。

不仅如此,昆仑万维甚至将Deep Research Agent框架开源,并把文档、PPT、表格生成能力封装成MCP供开发者调用。这波格局,确实打开了。

写在最后

测完天工超级智能体和SkyClaw-v1.0,我最大的感受是:AI工具的竞争,已经从“谁的回答更聪明”卷到了“谁的交付更完整”。单纯比拼单次对话的智力已经不够了,谁能把任务拆解、工具调用、多模态生成和成本控制揉在一起,谁才是真正的生产力工具。

以前用GPT-5.5生成脑图,能用是能用,但美观度总是差强人意。现在国产AI已经能把一连串多模态输出做稳、做漂亮,甚至把Agent从“可演示的玩具”推进到了“可高频调用、可真实交付”的生产力阶段。

如果你也受够了在各种软件里复制粘贴、修修补补,不如去试试这个能“20分钟交全套”的国产AI,说不定会有意想不到的惊喜。


文章来源:大国AI导航(daguoai.com)综合整理自郭震AI实测文章及昆仑万维官方公开资料

© 版权声明

相关文章

暂无评论

none
暂无评论...