滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

快手可靈3.0系列AI模型開啟超前內(nèi)測圖片視頻生成能力全面進(jìn)階

時(shí)間：2026-01-31 17:06:09 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

快手公司近日宣布，其自主研發(fā)的新一代視頻生成模型可靈3.0系列已進(jìn)入超前內(nèi)測階段。該系列包含圖片3.0、視頻3.0及視頻3.0 Omni三個(gè)子模型，在原有技術(shù)基礎(chǔ)上實(shí)現(xiàn)了多項(xiàng)突破性升級，旨在為影視創(chuàng)作、廣告設(shè)計(jì)等領(lǐng)域提供更專業(yè)的生成式AI解決方案。

圖片3.0模型的核心升級聚焦于專業(yè)創(chuàng)作場景的適配性。通過引入視覺思維鏈（vCoT）技術(shù)，該模型可對輸入圖像進(jìn)行結(jié)構(gòu)化解構(gòu)推理，支持單圖或多圖批量生成邏輯連貫的系列畫面。輸出分辨率方面，新增2K與4K選項(xiàng)，滿足影視預(yù)演、場景設(shè)定等高精度需求。針對AI生成內(nèi)容常見的細(xì)節(jié)斷裂問題，研發(fā)團(tuán)隊(duì)通過Deep-Stack視覺信息流機(jī)制優(yōu)化了紋理與光影的過渡效果，同時(shí)強(qiáng)化了對構(gòu)圖比例、鏡頭視角等參數(shù)的控制精度，使生成畫面更符合專業(yè)創(chuàng)作規(guī)范。

在模型訓(xùn)練環(huán)節(jié)，快手創(chuàng)新性地采用強(qiáng)化學(xué)習(xí)框架，結(jié)合"真實(shí)感"與"電影質(zhì)感"雙重評估體系，通過數(shù)百萬組專業(yè)影視素材的對比學(xué)習(xí)，顯著降低了生成內(nèi)容的機(jī)械感。技術(shù)文檔顯示，該模型在人物面部特征、物體材質(zhì)等細(xì)節(jié)還原上已達(dá)到行業(yè)領(lǐng)先水平，特別在復(fù)雜光影場景下的表現(xiàn)力較前代提升40%以上。

視頻3.0模型則構(gòu)建了統(tǒng)一的多模態(tài)訓(xùn)練框架，支持文本、圖像、視頻片段的混合輸入。單次生成時(shí)長擴(kuò)展至15秒，并允許用戶在3-15秒?yún)^(qū)間自由調(diào)整。智能分鏡系統(tǒng)成為最大亮點(diǎn)，該系統(tǒng)可自動(dòng)解析文本指令中的場景轉(zhuǎn)換需求，智能調(diào)度特寫、中景、全景等景別切換，配合動(dòng)態(tài)機(jī)位調(diào)整功能，使生成視頻具備專業(yè)分鏡腳本的敘事邏輯。

針對影視創(chuàng)作中的核心痛點(diǎn)，視頻3.0模型在主體一致性控制方面取得突破。通過多圖/視頻錨定技術(shù)，用戶可鎖定特定角色的面部特征、服裝細(xì)節(jié)或物體形態(tài)，確保在復(fù)雜運(yùn)動(dòng)場景中保持視覺連貫性。音畫同步模塊新增五國語言及方言支持，采用深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)口型與語音的毫秒級匹配，在多人對話場景中可精準(zhǔn)區(qū)分角色發(fā)聲，文字生成模塊則通過超分辨率技術(shù)確保字幕清晰可辨。

作為高端版本，視頻3.0 Omni引入視頻主體特征庫功能，可提取3-8秒視頻中的角色形象、動(dòng)作特征及音色數(shù)據(jù)，建立可復(fù)用的數(shù)字資產(chǎn)庫。該技術(shù)通過特征解耦重組方案，實(shí)現(xiàn)形象、聲音、動(dòng)作的分離存儲與靈活調(diào)用，為影視IP開發(fā)、虛擬偶像運(yùn)營等場景提供技術(shù)支撐。音頻處理方面，創(chuàng)新性的采樣區(qū)間調(diào)整算法使音色還原度提升至92%，在跨語言內(nèi)容生成中仍能保持聲線特征穩(wěn)定。

更多>同類資訊

李亞鵬“帶貨一哥”正火卻停播：投身公益，流量與善舉如何共舞？

02-10

年貨市場熱潮涌動(dòng) 快遞物流全力以赴保障年貨“一路暢行”

02-10

草根逆襲：從銷售員到AI PCB龍頭，陳濤憑兩次抉擇鑄就2000億傳奇

02-10

阿里“奶茶攻勢”拉新：30億補(bǔ)貼能否為千問鋪就AI突圍之路？

02-10

谷歌Aluminum OS新動(dòng)向：Gemini深度集成，Google鍵+空格開啟智能新體驗(yàn)

02-10

特斯拉法國可靠性排名逆襲登頂豐田讓位車輛問題少獲認(rèn)可

02-10

假廣告引發(fā)熱議：OpenAI首款硬件產(chǎn)品究竟藏著什么秘密？

02-10

阿里達(dá)摩院RynnBrain開源：推倒具身智能“智力高墻”，加速產(chǎn)業(yè)進(jìn)化

02-10

70邁黑冰糖A400 Pro行車記錄儀京東上架，大廣角+智能WDR，169元起售

02-10

理想L9煥新出擊：李想押注具身智能，能否重奪市場高地？

02-10

新一代小米SU7全面升級：續(xù)航提升、動(dòng)力增強(qiáng)、智能與舒適性再進(jìn)階

02-10

多家快遞公司辟謠春節(jié)停運(yùn)：繼續(xù)提供收派服務(wù)

02-10

特斯拉北美銷售負(fù)責(zé)人將離職，核心高管變動(dòng)頻繁

02-10

一月兩張巨額“罰單”，千億快手頻踩“紅線”？

02-10

谷歌旗下Waymo宣布在美國納什維爾實(shí)現(xiàn)完全無人駕駛運(yùn)營

02-10

點(diǎn)擊查看更多 +

全站最新

港股收評：Seedance2.0引爆！AI應(yīng)用股大漲，影視股走強(qiáng)

特朗普定“KPI”！沃什要帶美國GDP沖15%？

預(yù)售破億！春節(jié)檔票房大戰(zhàn)打響，哪些公司將受益？

稀缺的邊端側(cè)AI芯片標(biāo)的，愛芯元智(0600.HK)正式上市迎來價(jià)值重估

濱江集團(tuán)(002244.SZ)：競得土地使用權(quán)

K線暫歇，溫情歸位：2026年春節(jié)休市指南

熱門內(nèi)容

本欄最新

字節(jié)Seedance2.0內(nèi)測調(diào)整：暫停真人人臉參考平衡創(chuàng)新與安全責(zé)任

大曉機(jī)器人獲螞蟻集團(tuán)領(lǐng)投天使輪融資，以創(chuàng)新范式推動(dòng)具身智能產(chǎn)業(yè)新發(fā)展

新一代小米SU7升級亮點(diǎn)多：續(xù)航提升、電機(jī)換新、智駕與舒適性再進(jìn)階

小米YU7現(xiàn)身美加州公路引猜測，雷軍回應(yīng)：暫無進(jìn)軍美國市場打算

小米YU7 GT賽道版來襲！雙電機(jī)爆1003馬力，3秒破百極速300km/h

雷軍微博發(fā)聲：小米汽車短期無赴美計(jì)劃，SU7換代款4月將上市

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

快手可靈3.0系列AI模型開啟超前內(nèi)測 圖片視頻生成能力全面進(jìn)階

快手可靈3.0系列AI模型開啟超前內(nèi)測圖片視頻生成能力全面進(jìn)階