Anthropic斥资数亿美元收购Bun,Claude Code年化营收破10亿美元开启AI基础设施竞争新纪元
AI编程工具正从应用层竞争转向基础设施竞争,最快的运行时与最强的AI代理结合将重塑软件开发范式。 人工智能公司Anthropic今日正式宣布收购JavaScript/TypeScript运行时平台Bu...
北京智源研究院发布多模态世界模型Emu3.5,实现从“生成内容”到“理解世界”的跨越
模型以34B参数统一多种任务,支持高精度预测真实世界下一秒状态,已开源供全球开发者使用。 2025年10月30日,北京智源人工智能研究院推出开源多模态世界模型Emu3.5,该模型突破传统图像生成范畴...
可灵O1重磅发布:全球首个统一多模态视频模型,视频创作进入“P图式”编辑时代
无需在多个工具间来回切换,只需在一个输入框内用自然语言描述,视频创作变得像P图一样简单。 2025年12月2日,快手旗下的可灵AI正式推出全球首个统一多模态视频大模型——可灵O1。这一创新模型采用MV...
OpenAI启动“红色警报”应对谷歌Gemini威胁,暂停广告业务全力保卫ChatGPT
面对谷歌Gemini的强势崛起和自身增长放缓的迹象,OpenAI首席执行官萨姆·奥特曼不得不宣布进入“红色警报”状态,暂停包括广告业务在内的多个非核心项目,将资源集中用于提升ChatGPT的竞争力。 ...
乐鑫发布智能旋转底座EchoEar-Base,声源识别技术重塑喵伴人机交互体验
旋转底座配合声源定位,让AI助手真正“面向”用户 大国AI导航 2025年12月2日 乐鑫信息科技最新推出的EchoEar-Base智能旋转底座,将声源识别技术与多动作控制相结合,为AI交互设备带来全...
AI视频生产革命:拍我AI V5.5实现音画同步多镜头叙事,生成效率提升3倍
一次提示词,直接生成带有多镜头切换、角色口型同步的完整叙事视频,AI视频生成正式步入实用化阶段。 大国AI导航(daguoai.com) 2025年12月2日 摘要:爱诗科技旗下拍我AI(PixVer...
Vidu Q2生图功能掀起“一致性革命”,限时免费使用引爆创作圈
控制权正被交还给创作者,AI生图工具从“玩具”变为“生产力工具”的转折点已经到来。 生数科技今日全球同步上线Vidu Q2生图功能,主打“超强一致性”的参考生图、文生图和图像编辑三大核心能力。该版本在...
阿里通义团队发布Z-Image图像生成模型,开源6B参数版本刷新性能标杆
支持复杂中英文双语渲染,5秒生成高清图像,开源社区迎来专业级图像生成工具 2025年11月29日,阿里通义团队正式发布Z-Image(造相)图像生成模型系列,其中开源发布的6B参数Z-Image-Tu...
Ollama推出云端大模型服务,免费提供顶级AI模型访问权限
从本地部署到云端智能,Ollama在保持简洁体验的同时,降低了顶级大模型的使用门槛。 2025年11月,AI工具Ollama宣布推出云端大模型服务,用户现在可以通过简单的命令直接运行多个顶级大模型,包...
本地部署PaddleOCR指南:消费级显卡轻松运行,完美支持图片与PDF解析
2025年10月发布的PaddleOCR-VL模型,以0.9B参数量在多项OCR基准测试中超越GPT-4o等大模型,登顶HuggingFace Trending全球榜首。 近日,百度飞桨推出的Padd...