蘋(píng)果 AI 研究團(tuán)隊(duì)近日推出了名為 LiTo(表面光場(chǎng)標(biāo)記化)的3D 生成大模型。該技術(shù)攻克了3D 重建領(lǐng)域的長(zhǎng)期難題,實(shí)現(xiàn)了僅憑一張平面圖像即可生成具有高保真光影效果的完整3D 對(duì)象。
LiTo 的核心在于創(chuàng)新性地應(yīng)用了潛在空間(Latent Space)及首創(chuàng)的統(tǒng)一3D 潛在表示法:
高效編碼:將復(fù)雜的表面光場(chǎng)數(shù)據(jù)壓縮為緊湊的向量集,通過(guò)數(shù)學(xué)描述掌握物體幾何形狀與光線交互的物理規(guī)律。
雙向機(jī)制:采用編碼器-解碼器架構(gòu)。編碼器負(fù)責(zé)提取幾何結(jié)構(gòu)與外觀特征;解碼器則負(fù)責(zé)逆向還原,能夠精準(zhǔn)復(fù)現(xiàn)鏡面高光和菲涅爾反射等高級(jí)視覺(jué)效果。
性能表現(xiàn):多視角光影的一致性為了訓(xùn)練 LiTo,研究團(tuán)隊(duì)使用了包含數(shù)千個(gè)對(duì)象的3D 數(shù)據(jù)集。實(shí)驗(yàn)結(jié)果顯示:
解決方向偏差:LiTo 嚴(yán)格遵循攝像機(jī)坐標(biāo)系,解決了同類(lèi)模型常見(jiàn)的物體朝向錯(cuò)誤問(wèn)題。
指標(biāo)領(lǐng)先:在多視角光影一致性指標(biāo)上,LiTo 較目前頂尖的 TRELLIS 模型提升了約 37%。
這一成果標(biāo)志著3D 內(nèi)容創(chuàng)作門(mén)檻的進(jìn)一步降低,未來(lái)有望為增強(qiáng)現(xiàn)實(shí)(AR)以及空間計(jì)算設(shè)備(如 Vision Pro)提供更高質(zhì)量的素材生成支持。










