夢瑤 發自 凹非寺
量子位 | 公眾號 QbitAI
李飛飛世界模型新成果又又又來了!
World Labs直接一口氣放出了兩款新模型:Marble 1.1和Marble 1.1-Plus。
主打一個——幾分鐘,就能把真實地點「搬」進3D世界~(開眼啦.jpg)
例如,隨手拍幾張房間的多視角照片然后喂給模型,我們就能得到一個能自由查看、帶空間感的完整3D房間:
哪怕只有一張普通照片,它也能直接往外長出一個超超超大視野的3D世界,是不是有點VR眼鏡的效果了!
還沒完,因為除了能用平面生成3D世界外——
模型還能將原本高糊的畫面提高清晰度,提高畫面亮度對比度,最后生成一個視覺細節更豐富的視覺效果:
網友看到這效果,真·蚌埠住了,直言:這簡直是每個室內設計師的夢想!!
Marble 1.1系列模型一手實測
雖說兩款模型都屬于Marble 1.1字輩兒的同系列模型,但是吧,倆模型在生成能力上還是各有側重點的。
具體區別我也幫大家淺淺總結了一下:
*Marble 1.1模型:更偏向畫質優化,重點提升光照和明暗對比,前代里常見的過曝、泛白這類問題會明顯減少。
*Marble 1.1-Plus模型:更偏向空間生成,能在原有平面圖基礎上自動補出更大的3D覆蓋范圍,拉出一個更完整、更開闊的大世界。
使用方法也非常簡單,我們直接在Marble官網中選擇對應的模型就可以使用了。
話不多說,我們直接實測走起,先來考一下Marble 1.1的畫面處理能力如何!
這次我給Marble 1.1喂了一張ChatGPT生成的《我的世界》同款風格的視覺平面圖,長這樣子:
△ 參考圖
大概等了3~5分鐘,一個可以360度自由切換視角、空間感很強的3D游戲世界就被roll出來了,be like:
△ Marble 1.1輸出效果
前面我們也提到過,Marble 1.1模型最大的亮點就是「畫質」上的體現。
從這組輸入輸出的對比來看,成片后的分辨率并沒有啥問題,而且幾乎可以說是1:1還原,畫面里也沒有冒出特別明顯的噪點。
不僅如此生成結果在色彩表現上更飽滿一點,空間里的光感也更完整了,整體質感還是非常ok的!!
我們干脆趁熱打鐵,同一張圖,我們再丟給Marble 1.1-Plus,康康模型會整出什么花活~
(我等,我等,我狂等)
△ Marble 1.1-Plus輸出效果
咋說呢,從整體的視覺延展度度確實感覺比1.1模型更好。
同樣一張圖,Marble 1.1-Plus拉出來的空間尺度會更大一些,畫面往遠處鋪開的感覺也更明顯。(大家覺著呢)
but——問題也來了。
和剛才1.1的結果放在一起對比之后,會發現1.1-Plus在畫質細節上反而稍微吃虧一點,整體看上去有一點發糊??
API方面呢,目前默認調用的仍是上一代Marble 1.0,但官方表示后續會將默認模型切換為Marble 1.1,大家可以蹲蹲。
另外,此前的Marble-0.1-plus、Marble-0.1-mini等舊命名后續會逐步移除,并統一映射到1.0系列:
OMT
其實如果我們把這次新發布的Marble 1.1放回到World Labs自己的技術路線里看,它其實更接近他們這兩年反復強調的一個關鍵詞——spatial intelligence(空間智能)。
從這次發布的兩個新模型的表現來看,也確實能感覺到模型在「空間能力」上的明顯提升:
Marble 1.1讓輸出畫質質量更強,Marble 1.1-Plus讓空間覆蓋范圍更廣,也算是對技術路線又一次比較具體的落地展現了。
當然了,問題嘛,也很明顯。
大家也發現了,那就是現階段的世界模型,似乎還很難完美兼顧 「大空間」與「高畫質」……
像Marble 1.1-Plus這種能大范圍擴展空間的模型,面對輸入圖之外的未知區域,本質上是在做智能腦補。
為了保證龐大場景的邏輯自洽,模型往往不得不采用更保守、平滑的生成策略,世界一旦做大,模型要處理的信息量就會成倍往上走。
那代價嘛,就是——《糊圖》。
當然了,成本問題也是一方面,按照現在的定價,模型只能在空間范圍和畫質細節之間找平衡擇其一了…
(期待有二者兼得的那一天…)
模型確實是好模型,也確實很好玩,感興趣的友友可以直接上手試試~











