FlashLabs Chroma 1.0:全球首个开源端到端实时语音对话模型,开启个性化语音克隆新纪元
摘要: 2026年1月,FlashLabs公司正式发布了全球首个开源、端到端、实时的语音到语音(Speech-to-Speech)AI模型——Chroma 1.0。该模型彻底摒弃了传统的“语音识别(A...
王小川直言医疗AI“假货泛滥”!百川新模型幻觉率低至2.6%,两周免费开放
摘要: 2026年1月22日,百川智能发布新一代循证增强医疗大模型Baichuan-M3 Plus,其医学事实性幻觉率降至2.6%,达到全球最低水平。该模型首创“证据锚定”技术,能将每一句医学结论精确...
OpenAI豪掷百亿美元押注晶圆级芯片,AI模型推理速度将迎来革命性飞跃
当全球AI巨头们还在为训练算力疯狂堆砌GPU时,OpenAI已悄然调转船头,与芯片新贵Cerebras签下超百亿美元订单,直指AI应用最关键的瓶颈——推理速度。 2026年1月14日,OpenAI与A...
谷歌D4RT引爆4D重建革命:比现有技术快300倍,为具身智能装上“时空之眼”
摘要:谷歌DeepMind最新发布的D4RT(Dynamic 4D Reconstruction and Tracking)模型,彻底颠覆了动态4D场景重建领域。它通过一个统一的“时空查询”接口,将复...
MiroThinker 1.5深度评测:2026开年AI黑马,如何用“科学家思维”破解幻觉难题
摘要: 2026年初,开源深度研究智能体MiroThinker发布1.5版本,凭借仅300亿参数实现了与万亿级模型相匹敌的复杂任务处理能力。其核心突破在于摒弃了传统大模型的“记忆与复述”范式,转而采用...
Coze 2.0重磅升级:无需代码,3分钟打造可变现AI技能,AI开发平民化时代到来
摘要: 面对Claude Code等AI开发工具的高技术门槛,字节跳动旗下AI应用开发平台Coze于2026年1月推出2.0版本,通过“扣子编程”平台彻底革新AI技能(Skills)的创建、分发与变现...
阿里通义千问开源图像生成“缰绳”:Qwen-Image原生支持ControlNet,12GB显存即可精准可控创作
摘要:阿里云通义千问团队于近期开源了图像生成控制模型 Qwen-Image-2512-Fun-Controlnet-Union。该模型为业界领先的开源文生图模型Qwen-Image赋予了精准的结构控制...
Coze Skill开通教程:一文掌握技能商店生态与开发实战,开启AI技能变现新路径
摘要: 随着AI Agent平台“扣子(Coze)”正式上线技能商店功能,AI技能(Skill)的创作与商业化进入大众化时代。本文深度解析Coze技能商店的生态定位、与Claude Skills的核心...
扣子2.0深度评测:告别Prompt内卷,AI Agent如何成为你的“全能职场战友”?
摘要: 字节跳动旗下AI Agent平台“扣子”近日完成2.0品牌升级,核心推出“Agent Skills”(技能)与“Agent Plan”(长期计划)两大功能。此次升级标志着AI助手从被动的“聊天...
Claude Skills教程:从概念到实战,AI Agent能力扩展的新标准
摘要:Claude Skills是Anthropic推出的模块化能力扩展功能,它通过包含指令、脚本和资源的结构化文件夹,让AI代理(Agent)能够根据任务需求动态加载专业知识与工作流程。这一设计遵循...