滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

普林斯頓大學(xué)WAFT-Stereo：為立體視覺技術(shù)開啟高效精準(zhǔn)新篇章

時(shí)間：2026-04-08 06:08:53 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無障礙通道

計(jì)算機(jī)視覺領(lǐng)域迎來重大突破，普林斯頓大學(xué)研究團(tuán)隊(duì)提出名為WAFT-Stereo的立體匹配技術(shù)，為自動(dòng)駕駛、增強(qiáng)現(xiàn)實(shí)和機(jī)器人導(dǎo)航等領(lǐng)域帶來全新解決方案。這項(xiàng)發(fā)表于學(xué)術(shù)平臺(tái)arXiv的研究成果，通過顛覆性設(shè)計(jì)理念實(shí)現(xiàn)了精度與效率的雙重提升，標(biāo)志著立體視覺技術(shù)進(jìn)入實(shí)用化新階段。

傳統(tǒng)立體匹配技術(shù)依賴"成本體積"數(shù)據(jù)庫(kù)，需要為每個(gè)像素建立龐大的候選匹配清單，猶如在海量拼圖碎片中尋找配對(duì)。這種方法不僅占用大量?jī)?nèi)存，處理速度也難以滿足實(shí)時(shí)應(yīng)用需求。研究團(tuán)隊(duì)創(chuàng)新性地引入"特征空間扭曲"技術(shù)，通過直接變形右圖使其與左圖特征對(duì)齊，如同用魔法將兩張照片瞬間重合，徹底改變了傳統(tǒng)逐像素比對(duì)的繁瑣模式。

該技術(shù)的核心優(yōu)勢(shì)體現(xiàn)在內(nèi)存效率和處理速度的革命性提升。實(shí)驗(yàn)數(shù)據(jù)顯示，在ETH3D數(shù)據(jù)集上，WAFT-Stereo的零樣本測(cè)試錯(cuò)誤率較現(xiàn)有最佳方法降低81%，同時(shí)能以每秒10幀的速度處理qHD分辨率圖像，速度達(dá)到主流方法的1.8至6.7倍。更令人矚目的是，系統(tǒng)僅通過合成數(shù)據(jù)訓(xùn)練就能在真實(shí)場(chǎng)景中保持優(yōu)異性能，展現(xiàn)出強(qiáng)大的跨域泛化能力。

研究團(tuán)隊(duì)采用"先分類后回歸"的分層處理策略，將距離估計(jì)過程分解為粗粒度定位和精細(xì)調(diào)整兩個(gè)階段。系統(tǒng)首先將視差范圍劃分為40個(gè)區(qū)間，通過深度學(xué)習(xí)網(wǎng)絡(luò)預(yù)測(cè)像素所屬區(qū)間概率，再利用回歸方法進(jìn)行微調(diào)。這種設(shè)計(jì)使系統(tǒng)能在5次迭代內(nèi)達(dá)到傳統(tǒng)方法需要20次迭代才能實(shí)現(xiàn)的精度，處理效率提升300%。

在架構(gòu)設(shè)計(jì)方面，WAFT-Stereo摒棄了復(fù)雜的U形網(wǎng)絡(luò)適配層，轉(zhuǎn)而采用LoRA參數(shù)微調(diào)技術(shù)，在保持預(yù)訓(xùn)練模型性能的同時(shí)減少計(jì)算開銷。系統(tǒng)使用殘差網(wǎng)絡(luò)塊處理高分辨率細(xì)節(jié)，配合混合拉普拉斯損失函數(shù)進(jìn)行訓(xùn)練，有效解決了立體匹配中的邊界模糊和紋理失真問題。這些創(chuàng)新設(shè)計(jì)使系統(tǒng)在保持96%精度的前提下，參數(shù)量減少40%，推理速度提升2.3倍。

實(shí)際應(yīng)用場(chǎng)景中，這項(xiàng)技術(shù)展現(xiàn)出巨大潛力。在自動(dòng)駕駛測(cè)試中，配備WAFT-Stereo的測(cè)試車輛能更精準(zhǔn)識(shí)別200米外的障礙物，反應(yīng)時(shí)間縮短至0.1秒以內(nèi)。增強(qiáng)現(xiàn)實(shí)設(shè)備借助該技術(shù)可實(shí)現(xiàn)毫秒級(jí)的三維場(chǎng)景重建，使虛擬物體與真實(shí)環(huán)境的交互更加自然流暢。工業(yè)機(jī)器人應(yīng)用該技術(shù)后，裝配精度提升至0.1毫米級(jí)，操作速度提高3倍。

研究團(tuán)隊(duì)指出，當(dāng)前技術(shù)仍面臨強(qiáng)光照變化場(chǎng)景的適應(yīng)性挑戰(zhàn)。在Middlebury數(shù)據(jù)集的極端光照測(cè)試中，系統(tǒng)性能出現(xiàn)15%的波動(dòng)。針對(duì)這一局限，團(tuán)隊(duì)正開發(fā)光照自適應(yīng)算法，通過引入多尺度特征融合和動(dòng)態(tài)權(quán)重調(diào)整機(jī)制，提升系統(tǒng)在復(fù)雜光照條件下的魯棒性。

這項(xiàng)突破不僅代表算法層面的創(chuàng)新，更體現(xiàn)了計(jì)算機(jī)視覺研究范式的轉(zhuǎn)變。通過將光流估計(jì)領(lǐng)域的扭曲技術(shù)遷移至立體匹配任務(wù)，研究證明了跨領(lǐng)域知識(shí)融合的價(jià)值。這種"簡(jiǎn)化設(shè)計(jì)"理念為人工智能發(fā)展提供新思路——通過優(yōu)化核心機(jī)制而非單純?cè)黾幽Ｐ蛷?fù)雜度，同樣能實(shí)現(xiàn)性能躍升。

隨著WAFT-Stereo技術(shù)的逐步落地，立體視覺設(shè)備將迎來顯著升級(jí)。智能手機(jī)攝像頭可能集成實(shí)時(shí)三維建模功能，AR眼鏡可實(shí)現(xiàn)更精準(zhǔn)的空間定位，自動(dòng)駕駛系統(tǒng)將具備更可靠的環(huán)境感知能力。這項(xiàng)研究為構(gòu)建智能數(shù)字世界奠定了關(guān)鍵技術(shù)基礎(chǔ)，其影響將遠(yuǎn)超學(xué)術(shù)范疇，深刻改變?nèi)藗兊娜粘Ｉ罘绞健?/p>

04-08

MSU與FusionBrain Lab聯(lián)手：Calibri讓AI繪畫模型性能飆升更高效

04-08

AI編程新紀(jì)元：Composer 2以環(huán)境交互與推理能力引領(lǐng)軟件革新

04-08

華盛頓大學(xué)推出VFig系統(tǒng)：AI化身圖形“翻譯師” 讓圖片秒變可編輯矢量圖

04-08

吉利汽車與紫光展銳強(qiáng)強(qiáng)聯(lián)合四大方向發(fā)力共筑汽車產(chǎn)業(yè)新未來

04-08

英偉達(dá)押注亞太AI算力新勢(shì)力，F(xiàn)irmus估值377億沖刺IPO

04-08

天開和平園大模型備案服務(wù)中心成立助力20余家企業(yè)模型合規(guī)上線

奔牛云鏈主要從事互聯(lián)網(wǎng)物流的大模型研發(fā)，去年7月入駐天開和平園模創(chuàng)社區(qū)。在模創(chuàng)社區(qū)，像奔牛云鏈這樣的大模型企業(yè)，已經(jīng)聚集了20多家。為此，模創(chuàng)社區(qū)將大模型備案服務(wù)中心落地園區(qū)，不僅給企業(yè)申報(bào)進(jìn)行前期指導(dǎo)，…

04-08

華為AI戰(zhàn)略：扎根千行百業(yè)，在產(chǎn)業(yè)“泥濘”中打響數(shù)智突圍戰(zhàn)

這讓華為實(shí)現(xiàn)了一個(gè)可復(fù)制的模式：它不是去幫每一家企業(yè)從頭寫代碼，而是在底層把“非標(biāo)的行業(yè)經(jīng)驗(yàn)”與“標(biāo)準(zhǔn)的算力架構(gòu)”之間的對(duì)接通道打通。從打透一個(gè)場(chǎng)景的小勝，到橫跨80多個(gè)國(guó)家、數(shù)萬個(gè)客戶的大勝，這是一…

04-08

太空算力成新藍(lán)海：多方合力突破技術(shù)瓶頸加速構(gòu)建天地協(xié)同網(wǎng)絡(luò)

04-08

210克輕量化手套問世，具身智能數(shù)據(jù)采集迎來“頭手協(xié)同”新范式

這種“頭手協(xié)同”的能力，確保了動(dòng)作與視野的同步記錄，極大提升了數(shù)據(jù)采集的連貫性與準(zhǔn)確性，也為后續(xù)的多模態(tài)模型訓(xùn)練提供了高質(zhì)量對(duì)齊數(shù)據(jù)。 Dex不僅在硬件層面實(shí)現(xiàn)了高精度、多模態(tài)、無感穿戴，更在系統(tǒng)層面構(gòu)建了…

04-08

讓機(jī)器人喂飯更靠譜！科學(xué)家研發(fā)“擁抱”食物的Kiri-Spoon勺子

最近，來自弗吉尼亞理工大學(xué)和康奈爾大學(xué)的研究團(tuán)隊(duì)另辟蹊徑，他們提出了一個(gè)全新的假設(shè)：與其讓算法去適應(yīng)為人類設(shè)計(jì)的工具，為什么不為機(jī)器人設(shè)計(jì)一款全新的、更智能的餐具呢？更關(guān)鍵的是，在處理豆腐、果凍這類柔軟、濕…

04-08

宏明電子：MLCC未涉人形機(jī)器人少量產(chǎn)品用于關(guān)節(jié)且營(yíng)收占比小

有投資者向宏明電子（301682.SZ）提問，公司產(chǎn)品能不能應(yīng)用在機(jī)器人及機(jī)器人相關(guān)產(chǎn)業(yè)上？ 4月7日，公司回答表示，公司MLCC產(chǎn)品尚未應(yīng)用于人形機(jī)器人領(lǐng)域，公司間接供應(yīng)的少量其他產(chǎn)品，最終用于機(jī)器人關(guān)節(jié)…

04-08

面壁智能獲數(shù)億元融資躋身獨(dú)角獸，資本青睞端側(cè)大模型賽道

近日，面壁智能完成新一輪數(shù)億元人民幣融資，由深圳市創(chuàng)新投資集團(tuán)（深創(chuàng)投）和匯川產(chǎn)投聯(lián)合領(lǐng)投，道禾長(zhǎng)期投資、國(guó)泰君安創(chuàng)新投、武岳峰科創(chuàng)等跟投。在算力約束下持續(xù)提升智能密度、真正在物理世界落地，是面壁一直以來堅(jiān)持…

04-08

DeepSeek V4又又灰度測(cè)試：全新界面、多模態(tài)重大升級(jí)沒跑了

04-08

最強(qiáng)AI編程Claude降智 AMD高管吐槽其變得又懶又笨

04-08

點(diǎn)擊查看更多 +

全站最新

小米汽車歐洲布局再提速：吸納特斯拉人才，2027出海或迎新突破

2026年車載激光雷達(dá)“千線”爭(zhēng)霸：華為禾賽速騰激戰(zhàn)，誰主沉浮？

雷軍馬云罕見聯(lián)手！杭州具身智能新秀千尋智能30天狂攬30億融資

小米再攬?zhí)厮估诵娜瞬牛≈袣W物流負(fù)責(zé)人加盟，汽車出海布局加速推進(jìn)

2026年AI新趨勢(shì)：小米羅福莉押注“自進(jìn)化”，自進(jìn)化Agent或成關(guān)鍵

蘋果折疊屏iPhone試產(chǎn)引關(guān)注；問界M9新設(shè)計(jì)曝光，NASA阿耳忒彌斯2號(hào)創(chuàng)紀(jì)錄

熱門內(nèi)容

本欄最新

從造車到機(jī)器人網(wǎng)絡(luò)：AIROBO創(chuàng)始人先越如何解碼復(fù)雜系統(tǒng)運(yùn)營(yíng)新未來

吉利汽車與紫光展銳強(qiáng)強(qiáng)聯(lián)合四大方向發(fā)力共筑汽車芯片產(chǎn)業(yè)新生態(tài)

AI數(shù)據(jù)中心“熱島效應(yīng)”凸顯：周邊升溫影響超3.4億人生活環(huán)境

MES與WMS深度融合：解鎖智能制造新路徑，驅(qū)動(dòng)生產(chǎn)倉(cāng)儲(chǔ)協(xié)同升級(jí)

AI深度賦能采購(gòu)與供應(yīng)鏈寶馬中國(guó)多智能體系統(tǒng)開啟數(shù)字化新篇章

AI深度賦能：寶馬中國(guó)采購(gòu)與供應(yīng)鏈開啟智能新篇護(hù)航新世代車型品質(zhì)升級(jí)

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

普林斯頓大學(xué)WAFT-Stereo：為立體視覺技術(shù)開啟高效精準(zhǔn)新篇章