自動駕駛技術領域迎來一項重要突破,Alphabet旗下自動駕駛企業Waymo近日宣布推出全新世界模型。該模型依托谷歌DeepMind團隊研發的通用世界模型Genie 3構建,能夠生成具有高度真實感的交互式3D環境,為自動駕駛系統訓練提供全新解決方案。與傳統仿真系統相比,這項技術突破在于解決了極端場景模擬的難題。
當前自動駕駛仿真平臺普遍存在技術瓶頸,多數系統通過采集實際道路數據構建訓練場景。這種模式導致模型對罕見事件的應對能力嚴重不足,例如突發的自然災害、非常規障礙物或特殊裝扮的行人等。Waymo團隊指出,現有系統在處理龍卷風、橫穿道路的大象群、快速移動的風滾草等極端情況時,往往因缺乏相關數據而表現欠佳。
新模型通過創新的技術架構突破了這一限制。研發團隊首先利用Genie 3的強大生成能力構建基礎知識庫,隨后運用獨特的后訓練技術將海量2D視頻數據轉換為LiDAR激光雷達可識別的三維信號。這種轉換機制使模型能夠模擬幾乎所有現實場景,包括那些發生概率極低的特殊情況。技術文檔顯示,該系統已實現從視覺信息到傳感器數據的完整映射鏈條。
在控制機制方面,該模型展現出獨特的三重交互能力。駕駛動作控制系統可精確模擬車輛操作反饋,場景布局系統支持動態環境要素調整,語言控制系統則允許通過自然語言指令修改環境參數。這些功能共同構成強大的模擬控制體系。研發團隊還開發出高效變體版本,可在保持模擬精度的同時延長單次模擬時長,顯著提升訓練效率。
這項技術突破為自動駕駛安全測試開辟了新路徑。傳統實車測試需要耗費大量時間和資源,且難以覆蓋所有極端場景。新模型通過數字化手段構建虛擬測試環境,不僅降低了測試成本,更使系統能夠反復演練罕見事件應對策略。Waymo工程團隊表示,該模型已進入實車驗證階段,初步測試顯示其對異常場景的識別準確率較傳統系統提升47%。






