摘要: Lemon Slice Agents近日发布其视频模型框架Slice-2,该技术仅需用户上传一张照片和一段音频样本,即可实时生成具备语义感知手势与身体动作的全身数字人视频,实现低延迟的实时视频通话互动。其每秒20帧的生成速度与平均2.8秒的响应时间,标志着实时交互式AI视频技术取得关键突破,在教育、电商、医疗及营销等领域具有广泛应用前景。
在人工智能技术持续重塑人机交互边界的今天,一项能够将静态照片瞬间转化为可实时对话的“数字人”技术,正引发业界广泛关注。2025年12月17日,Lemon Slice Agents正式发布了其新一代视频模型框架Slice-2,该技术框架宣称能够仅凭一张任意风格的人物图像和一段音频样本,实时生成具备丰富表情、语义感知手势及全身动作的交互式视频头像,为用户带来前所未有的沉浸式实时视频通话体验。
与过往需要复杂建模和长时间渲染的数字人技术不同,Slice-2框架的核心突破在于其“实时性”与“高表现力”的融合。根据官方信息,该框架专为实时交互式头像体验设计,能够在单个GPU上实现每秒20帧的生成速度,这意味着其视频生成速度快于人类的观看速度,从而打破了实时视频生成的障碍。在实际交互中,从用户输入到获得视频响应的平均时间仅为2.8秒,其中视频生成的核心环节仅需0.73秒,为流畅的“面对面”对话提供了技术基础。
其技术能力主要体现在三个方面:
伴随Slice-2模型的发布,Lemon Slice Agents同步推出了名为“Lemon Slice Live”的平台服务。用户通过平台上传一张照片,即可快速创建一个全交互式的“视频代理”(Video Agent)。这个代理能结合用户的语音输入,进行低延迟的“说话回应”,实现类似视频聊天的体验。
目前,该模型已向公众开放通用使用,并提供API接口和一站式网站嵌入功能,显著降低了企业和开发者集成先进AI视频能力的门槛。从已披露的信息看,这项技术被普遍认为能显著提升用户参与度和转化率,其应用已延伸至多个核心领域:
在信息过载的当下,一篇优秀的新闻稿不仅要传递事实,更需从用户视角出发,思考“这与我何干”以及“我能从中得到什么”。为提升本文对目标读者(如技术开发者、企业决策者、数字内容创作者)的价值及在搜索引擎中的可见度,本次改写遵循以下原则:
技术的最终目标是服务于人。Lemon Slice Agents的Slice-2框架,通过降低实时AI视频生成的门槛,为跨行业的人机交互创新打开了新的可能性。其发展也印证了当前内容创作与传播的一个核心趋势:优质的内容与互动体验,始终是打动用户、实现有效传播的基石。
文章来源: 大国AI导航 (daguoai.com) 基于Lemon Slice Agents官方发布信息及公开技术资料进行整合与编发。 声明: 本文内容仅供参考,不构成任何投资或决策建议。