一次将好莱坞级制作能力装进手机的尝试,让专业视频与图像创作走向大众化。
2025年12月初,阿里巴巴旗下千问APP进行了一次里程碑式的更新,正式接入国内最强AI生视频模型Wan 2.5和全球开源领先的AI生图模型Qwen-Image-Edit。最为突破性的是,生图功能完全免费不限次数,视频生成则允许免费用户每日创建10个内容,这标志着工业级多模态AI技术首次以如此低门槛的方式向普通用户开放。
Wan 2.5作为对标谷歌Veo 3的视频生成模型,其核心突破在于原生音画同步与10秒1080P高清视频生成能力。与以往需要后期配音的AI视频不同,Wan 2.5实现了声音与画面的同步生成。
在实际测试中,一个描述“中年男子在书房朗读”的场景,视频中的人物口型与朗读内容高度吻合,甚至连文本中的省略号都对应了适当的停顿表现。更复杂的测试案例中,一位美国女性在舞台上演讲,不仅英语口型精准匹配,手势动作也自然协调。
Qwen-Image-Edit模型在解决AI生图常见的人物崩脸和中文乱码问题上表现突出。该模型具备强大的视觉逻辑理解能力,在理解空间和几何关系方面表现出色,能够精准处理复杂指令。
千问APP最具创新性的价值在于实现了从图像到视频的一站式创作流程。用户生成一张图像后,可直接在同一个对话框内调用视频生成功能,让静态图像“活”起来。
例如,先使用Qwen-Image生成《疯狂动物城》角色图像,随后立即通过Wan 2.5创建这些角色手牵手跳舞的视频,并配上歌曲和字幕。这种无缝衔接的创作体验,彻底消除了以往需要在不同工具间切换的繁琐流程。
此次更新的深层意义在于,阿里巴巴将B端沉淀的多模态技术成功向C端场景落地。Qwen-Image系列在多项图像生成基准测试中表现优异,尤其是在文本渲染和图像编辑方面。而Wan 2.5则通过原生多模态架构,实现了视频生成的高效与精准。
与需要部署ComfyUI或苦等海外大厂内测资格相比,千问APP让顶尖AI技术变得触手可及。这种低门槛、高质量的结合,为内容创作领域带来了新的可能。
千问APP此次更新,不仅是技术实力的展示,更是对AI普及化的一次重要推动。将工业级视觉编辑和生成能力放入普通用户手掌,让创意不再受技术门槛限制。随着多模态AI技术的不断成熟,内容创作领域正迎来一个更加开放、便捷的新时代。
文章来源:根据千问APP官方更新说明及多方实测报告综合整理,参考来源包括网易订阅、搜狐科技、腾讯新闻等多家媒体2025年12月报道。