2 月 9 日消息,Alphabet 旗下自動駕駛技術企業 Waymo 當地時間本月 6 日宣布推出其世界模型。這一模型基于其兄弟企業谷歌旗下 DeepMind 的通用世界模型 Genie 3 打造,可生成逼真且交互式的 3D 環境。
Waymo 表示,自動駕駛行業的大多數仿真模型都是基于收集到的道路數據從 0 開始訓練的,這意味著上述模型缺乏對一些極其罕見的超常規事件的信息,難以應對龍卷風、大象、風滾草、恐龍頭套 Cosplay 等異常罕見事件。
而谷歌 Genie 3 為 Waymo 的世界模型提供了廣泛的知識基礎,Waymo 又在此基礎上通過后訓練將海量 2D 視頻信息轉化為 Waymo 自動駕駛硬件支持的 LiDAR 激光雷達信號,讓該模型幾乎可以生成任何場景。
Waymo 世界模型通過三種主要機制實現了強大的模擬控制能力,即駕駛動作控制、場景布局控制、語言控制(注:這里指在基礎生產內容上的各種環境背景變化調整)。在基礎版本之外,Waymo 世界模型還有支持更長時間模擬的更高效變體。









