1月27日消息,螞蟻集團旗下具身智能公司靈波科技宣布開源高精度空間感知模型 LingBot-Depth。
該模型基于奧比中光Gemini 330系列雙目3D相機提供的芯片級原始數(shù)據(jù),專注于提升環(huán)境深度感知與三維空間理解能力,旨在為機器人、自動駕駛汽車等智能終端賦予更精準、更可靠的三維視覺。
據(jù)介紹,在NYUv2、ETH3D等權(quán)威基準評測中,LingBot-Depth展現(xiàn)出代際級優(yōu)勢:相比業(yè)界主流的 PromptDA與PriorDA,其在室內(nèi)場景的相對誤差(REL)降低超過70%,在挑戰(zhàn)性的稀疏SfM 任務(wù)中RMSE誤差降低約47% 。
在家庭和工業(yè)環(huán)境中,玻璃器皿、鏡面、不銹鋼設(shè)備等透明和反光物體物體十分常見,但卻是機器空間感知的難點。傳統(tǒng)深度相機受制于光學(xué)物理特性,在面對透明或高反光材質(zhì)時,往往無法接收有效回波,導(dǎo)致深度圖出現(xiàn)數(shù)據(jù)丟失或產(chǎn)生噪聲。
針對這一行業(yè)共性難題,螞蟻靈波科技研發(fā)了“掩碼深度建模”(Masked Depth Modeling,MDM)技術(shù),并依托奧比中光 Gemini 330 系列雙目 3D 相機進行 RGB-Depth 數(shù)據(jù)采集與效果驗證。當(dāng)深度數(shù)據(jù)出現(xiàn)缺失或異常時,LingBot-Depth 模型能夠融合彩色圖像(RGB)中的紋理、輪廓及環(huán)境上下文信息,對缺失區(qū)域進行推斷與補全,輸出完整、致密、邊緣更清晰的三維深度圖。
值得一提的是,LingBot-Depth 模型已通過奧比中光深度視覺實驗室的專業(yè)認證。實驗中,奧比中光 Gemini 330 系列在應(yīng)用LingBot-Depth 后,面對透明玻璃、高反光鏡面、強逆光及復(fù)雜曲面等極具挑戰(zhàn)的光學(xué)場景時,輸出的深度圖依然平滑、完整,且物體的輪廓邊緣非常銳利,其效果顯著優(yōu)于業(yè)內(nèi)領(lǐng)先的3D 視覺公司 Stereolabs 推出的 ZED Stereo Depth 深度相機。
據(jù)了解,螞蟻靈波科技已與奧比中光達成戰(zhàn)略合作意向。奧比中光計劃基于 LingBot-Depth 的能力推出新一代深度相機。本周螞蟻靈波將陸續(xù)開源多款具身智能方向模型。











