一款在权威榜单上匿名登顶、力压字节快手的AI视频模型,最终被阿里巴巴正式认领,并宣布了明确的开放时间表。
2026年4月10日,阿里巴巴集团正式对外确认,近期在AI视频生成领域引发巨大关注的匿名模型“HappyHorse”(欢乐马),确系其旗下ATH事业群创新事业部研发的产品。
目前该模型正处于内测阶段,并计划于 4月30日正式开放API接口,标志着这款“黑马”模型即将进入商业化应用阶段。
HappyHorse 的首次亮相充满了神秘色彩。在第三方权威评测平台 Artificial Analysis 的 AI Video Arena 榜单上,一款未标注任何厂商信息的 “HappyHorse-1.0” 模型突然空降榜首。
其在文生视频(不含音频)赛道的 Elo 得分高达 1379分,在图生视频赛道更是达到 1411分,全面超越了此前大热的字节跳动 Seedance 2.0 及快手可灵 3.0 等知名模型。
一时间,其开发者身份成谜,甚至出现了多个山寨“官网”。直至4月10日,阿里巴巴 ATH 事业群出面认领,谜底才正式揭开。
HappyHorse 的诞生,与阿里巴巴近期重大的AI战略调整紧密相关。2026年3月16日,阿里巴巴宣布正式成立 Alibaba Token Hub(ATH)事业群,由集团CEO吴泳铭直接负责,旨在整合集团核心AI资源。
HappyHorse 正是ATH旗下“AI创新事业部”交出的首份成绩单。据悉,该团队由前快手可灵AI负责人张迪领衔,在2025年11月组建后,仅用5个月便完成了模型开发。
根据技术资料对比,HappyHorse 能在盲测榜单中脱颖而出,主要依靠其在技术架构和生成体验上的四大差异化优势。
核心技术架构:单流统一,一站式生成 与主流模型采用视频、音频分模块处理的“多流”或“级联”结构不同,HappyHorse 采用了 40层单流Transformer架构,对文本、图像、视频、音频进行统一建模。
这种设计相当于“一站式生成”,从根源上减少了多模块拼接带来的信息损耗和延迟,实现了更高效的推理。
原生音视频同步:告别“硬伤” 音画不同步是许多AI视频的痛点。HappyHorse 支持原生音视频联合生成,无需后期手动对齐。
其唇形同步错误率据称可低至 14.6%,口型、脚步声、环境音可一次性精准生成匹配,这对于电商直播、虚拟主播等场景至关重要,能节省超过50%的后期时间。
生成效率:8步极速,成本更低 在生成速度上,HappyHorse 采用了DMD-2蒸馏等技术,将去噪步数压缩至仅8步。
生成一段5秒的1080p视频,在单张H100显卡上仅需约38秒,比同类模型快30%以上,显著降低了规模化创作的成本和时间。
商业策略:闭源商用,对接阿里生态 在开放策略上,HappyHorse 明确为闭源商用模型,其API将首先在阿里云百炼平台上线。
这与阿里近期整体转向闭源的模型策略一致,也意味着其将深度融入阿里巴巴的电商、内容等商业生态。
目前,HappyHorse 仍处于内测阶段,尚未有任何公开的官方访问网址或应用。
阿里巴巴已通过官方微博“HappyHorse AI”明确提醒,网络上流传的所谓“官网”均非真实,用户需注意甄别。
对于普通开发者和企业用户,需要等待 4月30日API正式开放。届时预计将通过阿里云的相关平台(如百炼)提供服务,具体计费模式和接入细节有待官方进一步公布。
30秒选型指南:
随着HappyHorse的加入,AI视频生成领域的竞争格局将进一步加剧。其凭借单流统一架构和原生音视频生成能力,或许将为行业树立新的技术标杆。一切答案,有待4月30日其API开放后,在真实应用中揭晓。
文章来源:本文综合自第一财经《阿里巴巴:HappyHorse我们研发,将于近期开放API》(2026年4月10日)[用户提供文档],并参考了百度百科、中华网、南方+、腾讯新闻等媒体的公开报道,以及相关技术分析。