那个在AI视频竞技场匿名盲测中以压倒性优势登顶、却始终披着一层神秘面纱的"欢乐马",终于被阿里认领了。

4月10日,阿里巴巴正式宣布,代号HappyHorse的AI视频生成模型出自旗下ATH创新事业部之手,由原快手"可灵之父"张迪领衔打造。

此前,这只"欢乐马"一直以"匿名亚洲AI实验室"的名义低调测试,如今身份揭晓,或许会让竞争对手们感到些许压力。

HappyHorse的硬实力足以让任何对手侧目。作为全球首个原生支持音视频联合生成的开源大模型,它采用150亿参数的统一Transformer架构,将文本、图像、视频和音频的Token拼接成单一序列,实现了画面与声音的"原生同步生成"——这意味着生成的视频不再是默片,对话、脚步声、环境音都能与画面精准对齐。

HappyHorse评测结果

在权威评测平台Video Arena上,它包揽了文生视频和图生视频双料冠军,单张H100显卡生成一段5秒1080p视频仅需约38秒,效率惊人。

更令人玩味的是,在带音频的视频生成赛道上,它直接与字节跳动的旗舰模型Seedance 2.0打成了平手。

时间倒回两个月前,当字节跳动的Seedance 2.0横空出世,凭借多镜头叙事和60秒电影级成片能力惊艳业界时,阿里内部曾一度感到意外和紧迫。

彼时,字节在视频大模型领域抢占了先机,外界甚至开始讨论阿里在视频生成赛道上是否慢了半拍。然而,阿里选择了低调蓄力,让"欢乐马"匿名出征,在盲测中默默杀出重围,直到登顶榜首才亮明身份。

这一记"回马枪",似乎轮到让字节跳动感到意外和惊讶了。

多模态模型赛道上,中国AI企业正在上演一场你追我赶的精彩竞速。这种良性竞争,既推动着技术边界不断向外拓展,也让全球看到中国大模型的创新活力。赛道上的每一个奔跑者,都是赢家。