“AI教母”李飛飛參與創(chuàng)立的初創(chuàng)公司W(wǎng)orld Labs近日宣布完成新一輪10億美元融資,投資者陣容包括芯片行業(yè)巨頭英偉達(dá)、AMD,知名投資機(jī)構(gòu)A16Z以及軟件企業(yè)歐克特等。這家公司此前在隱身模式運(yùn)營一年多后,已獲得2.3億美元初始資金,此次再度獲得資本青睞,引發(fā)業(yè)界對(duì)空間智能技術(shù)的高度關(guān)注。
李飛飛團(tuán)隊(duì)的核心突破在于將傳統(tǒng)二維視覺認(rèn)知升級(jí)為三維空間理解。其推出的商業(yè)產(chǎn)品Marble通過輸入照片、視頻、文字描述或3D草圖,即可生成可編輯、可導(dǎo)出的完整虛擬世界。該模型突破了傳統(tǒng)視頻生成工具的局限,不僅支持精確的攝像機(jī)控制,還能呈現(xiàn)物體背面和底部的細(xì)節(jié),并搭載高斯?jié)姙R技術(shù)確保視覺真實(shí)性與幾何信息并存。
在應(yīng)用場景中,Marble展現(xiàn)出強(qiáng)大的創(chuàng)作能力。以客廳照片為例,系統(tǒng)能自動(dòng)還原沙發(fā)位置、窗戶光線等物理特征,生成可360度觀察的場景。盡管邊緣處理仍存在優(yōu)化空間,但整體效果已達(dá)到實(shí)用標(biāo)準(zhǔn)。該系統(tǒng)特別設(shè)計(jì)的Chisel三維編輯器,允許用戶通過結(jié)構(gòu)搭建與文字描述相結(jié)合的方式生成場景——輸入“奶酪房間配葡萄座椅”等指令,系統(tǒng)會(huì)自動(dòng)填充視覺細(xì)節(jié),這種結(jié)構(gòu)與風(fēng)格分離的設(shè)計(jì)理念借鑒了網(wǎng)頁開發(fā)的分層模式。
針對(duì)大型場景需求,Marble開發(fā)了場景擴(kuò)展功能。當(dāng)用戶接近場景邊界時(shí),系統(tǒng)可自動(dòng)生成銜接環(huán)境;通過作曲家模式,還能將多個(gè)獨(dú)立場景無縫拼接。這些特性使其區(qū)別于傳統(tǒng)實(shí)時(shí)渲染的世界模型,生成的三維環(huán)境具有持久性,可導(dǎo)出為標(biāo)準(zhǔn)文件格式,直接接入游戲引擎或VR設(shè)備進(jìn)行二次創(chuàng)作。
李飛飛將這項(xiàng)技術(shù)定義為“空間智能”,認(rèn)為其與大語言模型形成互補(bǔ):前者賦予機(jī)器觀察與建造能力,后者側(cè)重閱讀與寫作。她指出,當(dāng)機(jī)器理解物體在三維空間的互動(dòng)規(guī)律,其應(yīng)用將突破娛樂領(lǐng)域,深入科學(xué)研究和醫(yī)療實(shí)踐。這種技術(shù)愿景與圖靈獎(jiǎng)得主楊立昆的研究路徑形成鮮明對(duì)比——后者專注開發(fā)預(yù)測式世界模型,強(qiáng)調(diào)在抽象空間中學(xué)習(xí)物理規(guī)律,更適用于機(jī)器人控制與因果推理。
兩位頂尖科學(xué)家的分歧體現(xiàn)在技術(shù)路徑選擇上。李飛飛體系追求高保真視覺呈現(xiàn)與創(chuàng)作自由度,通過生成持久性三維環(huán)境服務(wù)虛擬制作;楊立昆方案則側(cè)重底層邏輯建模,通過預(yù)測世界變化規(guī)律提升機(jī)器人決策能力。這種差異本質(zhì)上是視覺導(dǎo)向與認(rèn)知導(dǎo)向的技術(shù)路線之爭。
在近期訪談中,李飛飛從哲學(xué)層面闡釋了技術(shù)命名初衷。她認(rèn)為世界既包含物理空間的幾何規(guī)則,也涵蓋思維層面的邏輯流動(dòng)。這種雙重定義貫穿其技術(shù)理念——在開發(fā)Marble時(shí),團(tuán)隊(duì)始終將人類尊嚴(yán)置于核心位置,強(qiáng)調(diào)AI應(yīng)作為創(chuàng)作者、醫(yī)療工作者的輔助工具,而非替代者。這種技術(shù)倫理觀,與其推動(dòng)空間智能發(fā)展的目標(biāo)形成有機(jī)統(tǒng)一。











