2026年5月,Runway正式发布Characters功能。官方给它的定位是“a real-time video agent API”——一个实时视频代理接口。简单说:你给它一张照片,它就能生成一个能跟你实时对话的“活”角色,输出的视频流是24fps高清画质,从你停止说话到角色开始回话,服务端延迟只有1.75秒。
具体技术实现上,Characters基于Runway自研的GWM-1(General World Model)世界模型。一次迭代生成4帧,24fps下约167ms。官方测量显示,diffusion transformer耗时约151ms,VAE decoder约119ms。Runway通过流水线设计,让上一批帧在解码的同时,下一批帧已经开始生成,实现了“边拍边直播”的效果。