近日,全球人工智能領域迎來一則重磅消息:一款名為HappyHorse-1.0的新型視頻生成模型悄然問世,并在國際權威AI評測平臺Artificial Analysis的Video Arena榜單中斬獲佳績。該模型由阿里巴巴旗下淘天集團未來生活實驗室研發,在沒有大規模宣傳的情況下,直接登頂文本轉視頻和圖像轉視頻(無音頻)類別的全球榜首,同時在帶音頻類別中位列第二,引發行業高度關注。
根據公開技術資料,HappyHorse-1.0采用40層單流自注意力Transformer架構,參數量達150億,具備原生音視頻同步生成能力。這一特性使其無需后期配音或口型對齊處理,即可直接輸出高質量視頻內容。在性能測試中,該模型在單張H100顯卡上生成1080p分辨率視頻僅需約38秒,顯著優于同類產品。
在評測平臺公布的Elo評分體系中,HappyHorse-1.0以1357分的成績超越字節跳動Seedance 2.0等競爭對手。其多語言支持能力同樣突出,目前可處理英語、普通話、粵語、日語、韓語、德語和法語七種語言的輸入指令,覆蓋全球主要語言市場。技術團隊透露,模型通過DMD-2蒸餾技術優化了計算效率,這是實現高速生成的關鍵突破。
值得關注的是,研發方選擇在4月9日同步開源該模型代碼,此舉或將加速視頻生成技術的普及進程。行業分析師指出,HappyHorse-1.0的推出標志著AI視頻生成領域進入新的競爭階段,其架構設計和工程實現對后續研發具有重要參考價值。不過目前官方尚未公布具體應用場景,市場正持續關注其商業化落地進展。










