清華大學智能產業研究院近日公布了一項針對自動駕駛領域的重要研究成果。該研究以安全關鍵場景為切入點,創新性地采用“眼動追蹤實驗+算法驗證”的雙重研究范式,首次系統解析了人類駕駛員與智能駕駛算法在視覺注意力分配機制上的根本性差異。研究團隊構建了包含三個層級的注意力量化模型,為理解人類駕駛行為提供了新的理論框架。
實驗設計突破傳統研究范式,招募專業駕駛員與普通駕駛者完成三類典型任務:道路風險識別、功能可用性判斷及異常事件檢測。通過高精度眼動儀記錄120名受試者的視覺軌跡,結合深度學習算法對20萬幀注視數據進行聚類分析,成功劃分出“本能反應-經驗判斷-認知推理”的三階段注意力演化模型。這一發現顛覆了學界對駕駛注意力單純依賴空間定位的傳統認知。
研究團隊將人類注意力模型植入現有算法體系,在AxANet、UniAD等主流感知算法及DriveLM視覺語言模型中嵌入語義注意力模塊。對比實驗顯示,改進后的算法在復雜場景理解準確率上提升27.3%,特別是在處理交通標志遮擋、非標準交通行為等邊緣案例時,性能提升幅度達41.6%。關鍵突破在于算法獲得了類似人類的語義優先級判斷能力,能夠自主識別"前方學校區域"比"道路施工"具有更高安全權重。
這項成果為自動駕駛技術發展開辟了新路徑。傳統方案依賴海量數據訓練提升模型泛化能力,而本研究證明通過引入人類認知機制中的語義理解模塊,可顯著降低算法對訓練數據的依賴度。在車載計算資源受限的現實條件下,這種輕量化改進方案使算法部署成本降低60%以上,特別適用于中低端車型的智能化升級。
實驗數據進一步顯示,專業駕駛員在認知推理階段的注意力分配占比達58%,而當前最先進的算法在該階段的表現不足12%。這種差距在雨雪天氣、城鄉結合部等非結構化場景中尤為明顯。研究負責人指出,未來工作將聚焦于構建動態語義權重庫,使算法能夠根據實時路況自動調整語義理解策略,這或將推動自動駕駛技術向真正類人化方向演進。











