AI視頻生成領域近日迎來重大轉折,一款名為HappyHorse的開源模型突然崛起,以碾壓性優勢登頂全球權威評測榜單Artificial Analysis Video Arena,引發行業震動。這款由阿里巴巴ATH創新事業部研發的模型,不僅在文本生成視頻和圖片生成視頻的四大細分賽道中全面超越字節跳動的Seedance 2.0,更以開源策略打破行業格局,迫使競爭對手緊急調整戰略。
根據評測數據,HappyHorse在文本生成視頻(不含音頻)賽道以1389分領先第二名Seedance 2.0達115分,圖片生成視頻(不含音頻)賽道更以1415分刷新歷史紀錄。即便在含音頻的綜合評測中,該模型仍保持顯著優勢,僅在圖片生成視頻(含音頻)賽道以2分之差微弱落后。這種全方位的領先得益于其創新的技術架構——作為全球首個原生支持音視頻聯合生成的開源模型,HappyHorse通過統一自注意力Transformer架構,將文本、圖像、音頻等多模態Token整合為單一序列,實現"一次推理生成成片"的突破,單張H100顯卡生成5秒1080p視頻僅需38秒。
模型背后的操盤手張迪成為行業焦點。這位技術傳奇人物擁有上海交通大學本碩學歷,2010年加入阿里巴巴后主導阿里媽媽大數據架構,2020年跳槽快手擔任技術總監,2024年以"技術一號位"身份帶領團隊研發出可靈AI兩代架構,被業界譽為"可靈之父"。2025年11月回歸阿里后,他僅用5個月就完成HappyHorse-1.0的開發,相較傳統大模型12-18個月的開發周期堪稱奇跡。更引人注目的是其職業軌跡:從阿里到快手,再從嗶哩嗶哩短暫任職后重返阿里,每次轉身都留下具有行業影響力的技術成果。
開源策略成為HappyHorse的制勝關鍵。與字節Seedance 2.0設置企業認證、百萬保證金、并發數限制等嚴苛準入條件不同,阿里選擇完全開源模型代碼和權重。這種差異在行業引發連鎖反應:據知情人士透露,字節AI視頻團隊在HappyHorse登頂后緊急召開會議,原定對Seedance 2.0實施的限制性條款被連夜調整,計劃全面放開企業認證和保證金要求。此前Seedance 2.0因版權爭議陷入困境——美國電影協會和影視演員協會指控其大規模使用受版權保護作品,導致字節被迫暫緩全球發售計劃,而HappyHorse通過開源社區協作模式有效規避了這類風險。
技術評測顯示,HappyHorse在場景真實感和唇形同步精度上表現卓越,支持英、中、日、韓等七種語言的音畫同步,詞錯誤率處于行業最低水平。但該模型在復雜動作控制和分鏡調度方面仍存在不足,更適合靜態場景生成而非動態敘事。這種特性與其技術路線密切相關:通過消除傳統模型"視頻生成-配音-口型對齊"的多階段流程,雖然提升了效率,卻犧牲了部分動作控制精度。相比之下,Seedance 2.0在生成長視頻時仍保持更好的角色連貫性,但在生成速度和開源生態上明顯落后。
行業觀察者指出,HappyHorse的崛起標志著AI視頻生成進入"開源制衡閉源"的新階段。阿里通過組織架構調整成立ATH創新事業部,將原通義實驗室升級為通義大模型事業部,顯示出全力押注AI視頻賽道的決心。而字節面對開源模型的沖擊,不得不重新評估其商業策略——既要解決Seedance 2.0的版權爭議,又要應對HappyHorse帶來的技術壓力。這場變局使得原本由字節主導、快手緊隨的競爭格局被徹底打破,中國AI視頻領域正式形成字節、阿里、快手三足鼎立的新態勢。











