北京航空航天大學(xué)的研究團(tuán)隊(duì)在機(jī)器人視覺(jué)領(lǐng)域取得重要突破,其開(kāi)發(fā)的神經(jīng)形態(tài)視覺(jué)系統(tǒng)在運(yùn)動(dòng)處理速度上達(dá)到現(xiàn)有主流光流技術(shù)的四倍,為自動(dòng)駕駛車輛、工業(yè)機(jī)器人和手術(shù)機(jī)器人等設(shè)備的實(shí)時(shí)響應(yīng)能力帶來(lái)顯著提升。相關(guān)成果已發(fā)表于國(guó)際權(quán)威期刊《自然-通訊》,引發(fā)科技界廣泛關(guān)注。
傳統(tǒng)機(jī)器人視覺(jué)系統(tǒng)依賴攝像頭連續(xù)拍攝靜態(tài)圖像,通過(guò)光流算法分析像素亮度變化來(lái)追蹤運(yùn)動(dòng)。這種方法處理單幀圖像可能需要超過(guò)0.5秒,對(duì)于時(shí)速120公里的自動(dòng)駕駛車輛而言,這意味著在感知延遲期間車輛可能前進(jìn)16米以上,存在嚴(yán)重安全隱患。研究團(tuán)隊(duì)負(fù)責(zé)人高碩(音譯)表示,現(xiàn)有技術(shù)難以滿足動(dòng)態(tài)場(chǎng)景下的實(shí)時(shí)性需求,尤其是復(fù)雜運(yùn)動(dòng)環(huán)境中的精準(zhǔn)追蹤。
在模擬駕駛測(cè)試中,該系統(tǒng)將運(yùn)動(dòng)感知延遲減少約75%,在機(jī)器人操作場(chǎng)景下將追蹤精度提升一倍。實(shí)驗(yàn)數(shù)據(jù)顯示,面對(duì)多重運(yùn)動(dòng)交錯(cuò)等復(fù)雜情況時(shí),新系統(tǒng)雖仍需依賴傳統(tǒng)光流算法進(jìn)行最終圖像解析,且在極端場(chǎng)景下表現(xiàn)存在局限,但其整體性能已明顯優(yōu)于現(xiàn)有方案。這表明未來(lái)機(jī)器視覺(jué)的響應(yīng)速度有望接近甚至超越人類水平。
專家指出,這項(xiàng)技術(shù)將顯著擴(kuò)展機(jī)器人的應(yīng)用場(chǎng)景。在家庭服務(wù)領(lǐng)域,機(jī)器人需要快速識(shí)別手勢(shì)變化和面部表情,更快的視覺(jué)反饋可使人機(jī)交互更加自然流暢。例如,當(dāng)用戶做出停止手勢(shì)時(shí),系統(tǒng)能夠在20毫秒內(nèi)完成識(shí)別并執(zhí)行指令,較傳統(tǒng)方案提升近4倍速度。
目前研究團(tuán)隊(duì)正致力于擴(kuò)大神經(jīng)形態(tài)硬件規(guī)模,并探索將其與現(xiàn)有AI系統(tǒng)整合的可行性。這項(xiàng)受生物啟發(fā)的視覺(jué)架構(gòu)若能突破工程化瓶頸,可能徹底改變機(jī)器人理解動(dòng)態(tài)世界的方式,為智能制造、智能交通和醫(yī)療機(jī)器人等領(lǐng)域帶來(lái)革命性進(jìn)展。











