在AI視頻生成領(lǐng)域,一款名為HappyHorse-1.0的開源模型近日成為焦點。這款由阿里巴巴內(nèi)部孵化的模型以黑馬姿態(tài)登頂Artificial Analysis視頻競技場排行榜,在文本生成視頻、圖片生成視頻等四大核心賽道中全面領(lǐng)先,其中圖片生成視頻(不含音頻)賽道更以1413分刷新紀錄,較第二名高出110分。
技術(shù)突破是該模型的核心競爭力。作為全球首個原生支持音視頻聯(lián)合生成的開源模型,HappyHorse采用40層統(tǒng)一自注意力Transformer架構(gòu),參數(shù)規(guī)模達150億。在硬件效率方面,單張H100顯卡生成5秒1080p視頻僅需38秒,較同類模型提升40%以上。多語言支持能力尤為突出,可實現(xiàn)英語、普通話、粵語等七種語言的精準唇形同步,詞錯誤率控制在行業(yè)最低水平。
該模型的技術(shù)基因可追溯至阿里內(nèi)部組織架構(gòu)調(diào)整。2024年3月,阿里CEO吳泳銘宣布成立ATH事業(yè)群,整合通義實驗室、MaaS業(yè)務(wù)線等五大核心板塊,重點布局AI基礎(chǔ)設(shè)施。4月8日,集團技術(shù)委員會正式成立,通義實驗室升級為獨立事業(yè)部,標志著阿里AI戰(zhàn)略進入全面加速期。HappyHorse正是在此背景下,由原淘天集團未來生活實驗室團隊研發(fā),后隨實驗室劃歸ATH事業(yè)群AI創(chuàng)新事業(yè)部。
商業(yè)化進程已同步啟動。阿里云銷售團隊正積極拓展AI短劇、漫劇等垂直領(lǐng)域客戶,計劃通過MaaS平臺向開發(fā)者提供模型服務(wù)。據(jù)內(nèi)部人士透露,HappyHorse已完成內(nèi)部上架,預(yù)計一周后正式對外發(fā)布。海外社交平臺顯示,阿里巴巴集團官方賬號已成為該模型首位關(guān)注者,釋放出強烈的市場信號。
行業(yè)格局面臨重塑。當(dāng)前全球視頻生成市場呈現(xiàn)梯隊化競爭態(tài)勢,字節(jié)跳動Seedance 2.0、快手可靈3.0等模型占據(jù)頭部位置。高盛研究報告指出,該領(lǐng)域市場規(guī)模將從2025年的30億美元激增至2030年的290億美元。HappyHorse的橫空出世,不僅驗證了阿里在多模態(tài)大模型領(lǐng)域的技術(shù)積累,更可能打破現(xiàn)有競爭格局,推動國產(chǎn)模型進入新一輪技術(shù)競賽。












