在AI視頻生成領域,一款名為HappyHorse-1.0的神秘模型突然成為焦點。這款模型在Artificial Analysis的Video Arena排行榜上強勢登頂,不僅在文本轉視頻賽道以1375的Elo分數領先第二名Seedance 2.0約100分,更在圖像轉視頻賽道創下1409的歷史最高分,甚至在有音頻賽道也超越Seedance 2.0奪得全球第一。
技術層面,HappyHorse-1.0采用40層單流Transformer架構,支持音視頻同步生成,僅需8步去噪即可輸出1080P視頻。在H100顯卡上生成5秒片段僅需38秒,推理速度較傳統模型顯著提升。其創新點包括多模態統一建模、無CFG引導生成等技術,并原生支持中(含粵語)、英、日、韓、德、法等多種語言。更值得關注的是,該模型計劃完全開源,基礎模型、蒸餾模型、超分算法及推理代碼都將對外開放。
關于模型歸屬,行業猜測集中在國內科技企業。其中,阿里旗下淘天集團未來生活實驗室成為最熱門候選,該實驗室由技術專家張迪領銜。張迪擁有上海交通大學本碩學歷,職級P11,直接向淘天集團首席科學家鄭波匯報。其職業經歷涵蓋阿里、快手和嗶哩嗶哩:2010年加入阿里負責大數據與機器學習架構;2020年轉戰快手主導可靈大模型研發;2025年短暫任職嗶哩嗶哩技術負責人后,于同年11月重返阿里執掌未來生活實驗室。
目前HappyHorse-1.0尚未建立官方網站,也未發布技術報告或開源代碼,市面上出現的所謂"官網"均已被證實為假冒。據知情人士透露,開發團隊正在加班完善相關材料,預計將在近期正式發布。這款模型的突然崛起,不僅改變了AI視頻生成領域的競爭格局,其開源計劃更可能推動整個行業的技術進步。隨著發布日期臨近,業界對這款"黑馬"模型的期待持續升溫。











