在解決自動駕駛問題的這場高風險競賽中,多年來已經出現了深刻的哲學和技術分歧。
一邊是幾乎整個汽車和科技行業,他們倡導一種叫做傳感器融合的概念——一種雙保險的方法,將攝像頭、雷達和激光雷達結合起來,構建一個冗余的、多層次的世界視圖。
而另一邊,特斯拉孤軍奮戰,大膽而有爭議地押注于單一模式——純粹的、基于攝像頭的視覺。
特斯拉主動移除并禁用車輛上的雷達等硬件的決定遭到了廣泛的質疑,但這一舉措源于其對人工智能和自然智能本質的深刻理解和根本信念。要理解特斯拉為何做出這樣的抉擇,首先必須了解特斯拉究竟摒棄了什么。
什么是傳感器融合?
傳感器融合的概念相當簡單。它旨在利用不同類型傳感器的獨特優勢,構建一個統一且高度魯棒的車輛周圍環境模型。每種傳感器都有其自身的優缺點,理論上,融合它們可以彌補每種傳感器的不足。
攝像頭能夠提供最豐富、最高分辨率的數據,像人眼一樣感知世界的色彩和紋理。它們可以讀取路標上的文字,識別交通信號燈的顏色,并理解復雜的視覺環境。它們的主要缺點是容易受到惡劣天氣和弱光環境的影響,而且難以測量相對速度。
雷達在測量物體距離和速度方面表現出色,即使在惡劣天氣下也能正常工作。它可以輕松穿透雨、霧和雪,但其弱點在于分辨率較低。無論如何計算,要達到與單個攝像頭在單一方向上相同的分辨率,需要一個12英尺乘12英尺的方形雷達陣列,耗資數百萬美元。雷達能夠準確地告訴你某個物體在哪里以及它的移動速度——只要它在移動——但它難以識別物體的種類,也難以識別靜止的物體。
激光雷達的工作原理與雷達類似,但它使用激光,能夠創建環境的精確三維點云地圖。它在測量距離和形狀方面精度極高,因此可以構建環境的高精度三維模型。其主要缺點是傳感器成本相對較高,以及在惡劣天氣條件下(尤其是在霧、雪和雨天)性能下降。激光雷達還有一個缺點:采集的數據量非常龐大,僅第一步的數據處理就需要巨大的計算資源。
這是業內公認的方法,Waymo 和 Cruise 等公司都采用這種方法,將來自這三個地方的數據融合在一起,創建一個具有內置冗余的系統。
特斯拉的起源:多傳感器方法
對許多人來說,這段歷史已被遺忘,但特斯拉最初并非只采用視覺輔助技術。從發布到 2021 年,早期的自動駕駛系統同時配備了攝像頭和前置雷達單元,這些雷達單元由博世等汽車傳感器專業公司提供。這是一種傳統的傳感器融合方案,其中雷達作為主要傳感器,用于測量前方車輛的距離和速度,從而實現諸如交通感知巡航控制和早期版本的 FSD Beta 等功能。
這種多傳感器方案多年來一直是標準做法。即使特斯拉開發了自己的定制版FSD硬件,人們仍然認為雷達會是關鍵組件,為蓬勃發展的視覺系統提供安全保障。然而,在2021年,特斯拉做出了徹底的轉變。
轉折點:特斯拉為何放棄雷達
這一轉變始于2021年夏季,當時特斯拉宣布將從新款Model 3和Model Y車型中移除雷達,轉而采用名為Tesla Vision的純攝像頭系統。此舉源于埃隆·馬斯克的核心論點,即傳感器數據沖突的危險性——而他至今仍在堅持這一觀點。
當兩個不同的傳感器系統提供相互矛盾的信息時,汽車會相信哪一個?哪個傳感器被認為是“更精確”或“更安全”的?這由汽車根據實際情況決定嗎?還是由工程師預先設定?傳感器信息不一致會帶來風險,因為決策過程可能會使車輛陷入癱瘓,尤其是在安全至上的情況下。
這并非僅僅是哲學層面的爭論,特斯拉的FSD工程師們也提供了具體的例子。在同一討論串中,特斯拉人工智能工程師蔡云達指出,雷達存在根本性的缺陷——它無法正確區分無法產生頻率偏移的靜止物體、橫截面較薄的物體或雷達反射率較低的物體。這正是過去困擾特斯拉的臭名昭著的“幽靈剎車”事件的根源所在:車輛可能會將靜止的立交橋或路邊的廢棄鋁罐誤認為是停著的車輛,從而導致不必要的剎車。
從特斯拉的角度來看,實現車輛自動駕駛的通用解決方案的關鍵在于解決視覺問題。人類駕駛時依靠兩顆生物攝像頭和一個強大的神經網絡。特斯拉的策略是,如果計算機視覺能夠完美運行,那么任何其他傳感器充其量只會分散注意力,最壞的情況則是造成危險的歧義。
如今,每一輛特斯拉新車都完全依賴于特斯拉視覺系統,該系統由八個攝像頭驅動。該系統利用復雜的神經網絡創建世界的三維矢量空間表示,車輛隨后分析該表示并在此基礎上進行導航。
關于視覺系統的故事還有一個有趣的注腳。特斯拉發布第四代硬件(現為AI4)時,新款Model S和Model X車型都配備了全新的高清雷達。然而,為了鞏固其對純視覺系統路線的堅持,特斯拉從未將這些雷達用于FSD(完全自動駕駛)功能。
事實上,特斯拉最普及的車型Model Y上的FSD系統才是最先進的,而不是那些配備額外傳感器的車型。雖然特斯拉可能確實會從這些雷達收集一些數據并驗證系統性能,但它們實際上并不屬于FSD套件的一部分。
二元結果
特斯拉放棄傳感器融合技術的決定,是其自動駕駛方案與其他廠商方案之間最大的區別。這是一場高風險、成敗在此一舉的賭博,而到目前為止,他們無疑贏得了這場賭博。
特斯拉、埃隆·馬斯克、阿肖克·馬斯克以及特斯拉人工智能團隊都認為,要打造一個可擴展的、通用的、能夠像人類一樣智能地在世界中導航的自動駕駛系統,唯一的途徑就是徹底解決視覺問題。如果他們的判斷正確,他們將創造出一個比競爭對手那些昂貴且配備大量傳感器的車輛更便宜、可擴展性更強的系統。
如果他們判斷錯誤,最終可能會遇到性能瓶頸,而只有這些傳感器才能突破這個瓶頸——但到目前為止,我們還沒有看到這種瓶頸的絲毫跡象。
如今,特斯拉全力投入其純視覺識別系統,沒有人能否認其取得的進步或具備的能力。






