螞蟻集團(tuán)旗下具身智能公司靈波科技近日宣布開源高精度空間感知模型LingBot-Depth,為機(jī)器人與自動駕駛領(lǐng)域帶來三維視覺技術(shù)突破。該模型基于奧比中光Gemini 330系列雙目3D相機(jī)的原始數(shù)據(jù)構(gòu)建,通過融合光學(xué)傳感與深度學(xué)習(xí)技術(shù),顯著提升了智能終端在復(fù)雜環(huán)境中的空間理解能力,尤其在透明物體、反光表面等傳統(tǒng)感知難題場景中展現(xiàn)出顯著優(yōu)勢。
在權(quán)威基準(zhǔn)測試中,LingBot-Depth刷新多項(xiàng)行業(yè)紀(jì)錄。NYUv2室內(nèi)場景測試顯示,其相對誤差(REL)較主流模型降低超70%;ETH3D稀疏SfM任務(wù)中,均方根誤差(RMSE)下降約47%。這種代際級性能躍升源于模型對RGB-D數(shù)據(jù)的深度整合能力——當(dāng)深度傳感器因透明材質(zhì)或強(qiáng)反光失效時(shí),系統(tǒng)可自動調(diào)用彩色圖像的紋理特征與環(huán)境上下文信息,通過掩碼深度建模(MDM)技術(shù)完成缺失區(qū)域的高精度補(bǔ)全。
實(shí)驗(yàn)數(shù)據(jù)證實(shí)技術(shù)突破的實(shí)用性。搭載LingBot-Depth的Gemini 330相機(jī)在玻璃器皿、鏡面反射等極端場景下,輸出的深度圖邊緣銳度提升40%,數(shù)據(jù)完整度達(dá)98.7%,顯著優(yōu)于Stereolabs ZED系列等國際領(lǐng)先產(chǎn)品。奧比中光深度視覺實(shí)驗(yàn)室認(rèn)證表明,該方案在保持消費(fèi)級硬件成本的同時(shí),將復(fù)雜場景適應(yīng)能力提升至工業(yè)級標(biāo)準(zhǔn)。
支撐技術(shù)突破的是靈波科技構(gòu)建的千萬級場景數(shù)據(jù)庫。研發(fā)團(tuán)隊(duì)采集近千萬原始樣本,篩選出200萬組高價(jià)值深度配對數(shù)據(jù)用于模型訓(xùn)練,其中包含200萬真實(shí)世界數(shù)據(jù)與100萬仿真數(shù)據(jù)。這套核心數(shù)據(jù)資產(chǎn)將隨模型代碼同步開源,為行業(yè)提供攻克復(fù)雜場景感知難題的基礎(chǔ)設(shè)施。
產(chǎn)業(yè)合作同步推進(jìn)。奧比中光已宣布將基于LingBot-Depth技術(shù)路線開發(fā)新一代深度相機(jī),重點(diǎn)優(yōu)化家庭服務(wù)機(jī)器人與自動駕駛汽車的近場感知能力。據(jù)悉,靈波科技本周還將陸續(xù)開源多款具身智能核心模型,構(gòu)建從環(huán)境感知到?jīng)Q策控制的完整技術(shù)生態(tài)。











