摘要: 火山引擎于2025年12月18日发布的音视频创作模型Seedance 1.5 Pro,凭借其创新的原生音视频联合生成架构,实现了毫秒级音画同步、精准的多角色多语言对话口型对齐,并支持包括粤语、四川话在内的多种方言。该模型在影视级叙事张力、镜头语言调度及商业化应用上展现出显著突破,标志着AI视频生成从“技术演示”迈向“实用创作”的关键一步。
在2025年12月18日火山引擎FORCE原动力大会上正式发布的Seedance 1.5 Pro,并非一次简单的版本迭代,而是对AI视频生成逻辑的一次重构。与以往“先生成画面,后配音对口型”的分离式流程不同,Seedance 1.5 Pro采用了创新的原生音视频联合生成架构。这意味着,视频的动作、声音、节奏是在同一个生成过程中协同产生的,而非后期拼接。
这一底层技术的革新,直接解决了AI视频中长期存在的“张口无声”或口型错位的顽疾。在实际测试中,模型能够精准捕捉不同角色的语音韵律与情感张力,实现毫秒级的音画同步。例如,在生成多角色对话场景时,模型不仅能准确对齐说话者的口型,还能让倾听者的角色产生自然的反应,如转头注视、眨眼等细微动作,使得互动极具真实感。
根据官方介绍和实测体验,Seedance 1.5 Pro的核心优势主要体现在以下三个方面:
除了核心生成能力的飞跃,Seedance 1.5 Pro在提升创作效率和降低成本方面也做出了实质性改进。火山引擎宣布,Seedance系列即将上线“Draft样片”功能。创作者可先生成低分辨率样片进行预览,其关键要素与最终成片高度一致,实现“预览即所得”。官方数据显示,该功能可帮助创作者提升约65%的整体效率,并减少60%的无效创作成本。
目前,个人用户已可在豆包App、即梦AI等平台体验Seedance 1.5 Pro模型。企业用户则可从12月23日起,通过火山引擎的API正式接入该模型服务。此外,在火山方舟体验中心,该能力已被整合进“模板化玩法”,进一步降低了普通用户的创作门槛。
Seedance 1.5 Pro的发布,是火山引擎在“多模态Agent(智能体)”战略下的关键落子。与其同步发布的豆包大模型1.8(Doubao-Seed-1.8),同样围绕打造强大的多模态Agent“大脑”进行升级,增强了复杂指令遵循和OS Agent能力。这表明,大模型行业的竞争重点已从单纯的参数规模比拼,转向了以多模态Agent为核心的产业落地和生态构建。
火山引擎总裁谭待披露的数据印证了市场的快速增长:截至2025年12月,豆包大模型日均token使用量已突破50万亿,较去年同期增长超过10倍。Seedance 1.5 Pro的出现,正是为了满足日益增长的高质量音视频内容创作需求,将AI视频技术从“炫技”推向“实用”,为影视创作、短剧生成、广告生产及数字营销等专业场景提供了新的生产力工具。
文章来源:综合自火山引擎FORCE原动力大会官方发布、光明网、上海证券报及行业实测分析。