《科創(chuàng)板日報》4月10日訊 3月25日,OpenAI宣布正式關(guān)停旗下視頻模型產(chǎn)品Sora。僅13天后,國產(chǎn)視頻模型“歡樂馬”HappyHorse橫空出世,并以1300的高分迅速屠榜Artificial Analysis。
據(jù)悉,Artificial Analysis是當(dāng)今權(quán)威的AI評測平臺,在該平臺視頻競技場前15名榜單中,可以看到字節(jié)跳動Seedance 2.0、昆侖萬維SkyReels V4、快手可靈3.0等一眾國產(chǎn)視頻模型的身影。相比之下,以谷歌Veo為代表的海外視頻模型僅占據(jù)寥寥幾個席位。
圖源:Artificial Analysis
Artificial Analysis視頻競技場的排名核心依據(jù)為“人類盲測投票+Elo評分系統(tǒng)”:在同一提示詞下,平臺隨機(jī)選取兩個模型生成視頻,用戶僅根據(jù)觀看體驗,投票選擇“更好的一段視頻”,隨后被選中的模型得分,落選的模型失分,并依照分?jǐn)?shù)實時生成排名。根據(jù)當(dāng)前結(jié)果,顯然國產(chǎn)視頻模型在盲測中更受用戶偏好。
國盛證券援引業(yè)內(nèi)人士表示,由于AI生成的視頻畫面具備一定隨機(jī)性,因此每次生成的內(nèi)容未必滿意,用戶需要同一提示詞使用多次,才能得到滿意的結(jié)果,業(yè)內(nèi)俗稱“抽卡”,單個鏡頭的抽卡次數(shù)可以高達(dá)7次之多。
面對同樣的隨機(jī)性,為何國產(chǎn)視頻模型生成內(nèi)容更符合用戶審美?
從邏輯上看,模型生成的內(nèi)容能否獲得用戶青睞,與模型自身能力并無絕對關(guān)聯(lián),卻更多取決于視頻質(zhì)量(如人物一致性、生成穩(wěn)定性)本身。而這正是國產(chǎn)視頻模型廠商的發(fā)力方向。
以HappyHorse為例,150億參數(shù)或許不及Sora、谷歌Veo等“參數(shù)巨獸”,但作為目前全球首個原生支持音視頻聯(lián)合生成的視頻模型,其原生支持英語、普通話、粵語、日語、韓語、德語、法語七種語言的唇形同步,詞錯誤率在同類開源模型中最低。
此前爆火的快手可靈、字節(jié)跳動Seedance也具有相似的特質(zhì)。根據(jù)對比測試,可靈2.0文生視頻大模型與Veo2的勝負(fù)比為205%,與Sora的勝負(fù)比為367%,在人物一致性、生成穩(wěn)定性等方面遙遙領(lǐng)先;而Seedance 2.0憑借強(qiáng)大的中文理解能力、多模態(tài)的文件輸入功能以及對視頻敘事連貫性的深度優(yōu)化,在多維度敘事、創(chuàng)意生成方面形成獨特優(yōu)勢。
除了穩(wěn)定可控的“提示詞-生成-成片”路徑,國產(chǎn)視頻模型還具有獨到的平臺生態(tài)優(yōu)勢。
誠然,字節(jié)跳動、快手等不僅是視頻模型廠商,更是擁有完整AI模型系列的內(nèi)容平臺型玩家。一方面,如中金公司所言,擁有通用大模型的綜合參與者在進(jìn)軍垂類模型時或擁有一定協(xié)同優(yōu)勢,僅簡單基于大模型開發(fā)的應(yīng)用或競爭力不足,而需要深度整合通用大模型和垂類模型化學(xué)反應(yīng)。從這個角度,綜合巨頭確實存在體系化優(yōu)勢。
另一方面,上述機(jī)構(gòu)強(qiáng)調(diào),以快手可靈等為代表的產(chǎn)品核心定位是創(chuàng)作者創(chuàng)意工具或社區(qū),其用戶更關(guān)注輸出內(nèi)容質(zhì)量、價格、一致性等維度。太平洋證券表示,AI視頻工具是模型能力轉(zhuǎn)化為實際生產(chǎn)力的載體,因其既依賴于模型技術(shù)支撐,又需專業(yè)視頻內(nèi)容制作實踐積累。未來,擁有技術(shù)領(lǐng)先優(yōu)勢的AI視頻工具公司更易依托自身創(chuàng)作能力與平臺生態(tài),產(chǎn)出優(yōu)質(zhì)視頻內(nèi)容。








