谷歌再次在人工智能領(lǐng)域掀起波瀾,其旗下DeepMind團(tuán)隊(duì)推出的世界模型Genie 3實(shí)驗(yàn)性研究原型「Project Genie」正式向公眾開放。這一創(chuàng)新項(xiàng)目允許用戶創(chuàng)建、編輯并探索虛擬世界,標(biāo)志著交互式環(huán)境生成技術(shù)邁入新階段。
作為通用世界模型Genie 3的延伸,Project Genie整合了圖像生成與編輯模型Nano Banana Pro和語(yǔ)言模型Gemini的技術(shù)優(yōu)勢(shì)。用戶可通過(guò)文本描述或上傳圖片創(chuàng)建動(dòng)態(tài)環(huán)境,定義角色行為模式——從步行、騎行到飛行均可實(shí)現(xiàn)。系統(tǒng)特別引入"世界草繪"功能,允許用戶在進(jìn)入虛擬場(chǎng)景前預(yù)覽并調(diào)整視覺效果,甚至切換第一人稱或第三人稱視角。
該平臺(tái)的核心突破在于實(shí)時(shí)路徑生成技術(shù)。當(dāng)用戶移動(dòng)角色時(shí),系統(tǒng)會(huì)根據(jù)交互行為動(dòng)態(tài)延伸場(chǎng)景,這種突破性的一致性使機(jī)器人訓(xùn)練、動(dòng)畫制作乃至歷史場(chǎng)景重建成為可能。目前開放的功能包含三大模塊:環(huán)境創(chuàng)建、交互探索和內(nèi)容重混。用戶既能從零構(gòu)建虛擬世界,也可基于現(xiàn)有作品進(jìn)行二次創(chuàng)作,最終生成的視頻內(nèi)容支持下載保存。
首批體驗(yàn)的Google AI Ultra用戶已展示出驚人創(chuàng)造力。有人構(gòu)建出"法國(guó)女子攀越非邏輯世界"的奇幻場(chǎng)景,墻壁漂浮著飛行物體;另有用戶嘗試讓系統(tǒng)運(yùn)行經(jīng)典游戲《毀滅戰(zhàn)士》,創(chuàng)造出嵌套式的屏幕迷宮。這些作品雖然存在物理模擬瑕疵——比如水獺飛行員頭頂鴨子、角色開門動(dòng)作略顯僵硬——但已展現(xiàn)出技術(shù)潛力。
項(xiàng)目團(tuán)隊(duì)坦言當(dāng)前版本存在局限性:生成內(nèi)容時(shí)長(zhǎng)限制在60秒內(nèi),部分預(yù)設(shè)功能如"提示事件"尚未開放,角色控制偶發(fā)延遲。但這些不足并未削弱技術(shù)社區(qū)的熱情,用戶在社交平臺(tái)分享的創(chuàng)作視頻已引發(fā)廣泛討論。隨著更多用戶參與測(cè)試,這個(gè)專注于沉浸式世界構(gòu)建的平臺(tái)有望持續(xù)進(jìn)化,重新定義數(shù)字內(nèi)容的創(chuàng)作方式。











