之前跟waymo前員工聊了有關於waymo的一些東西,另外又聽了矽谷101最新的一期介紹FSD和robotaxi的分享,阿財透過多年來一直追蹤自動駕駛領域的視角和大家分享自己的看法,個人觀點文長慎入...
首先FSD大家最關注的問題像是安全性和拓展性等,端到端目前特斯拉算是大規模的驗證已經成功用在自動駕駛,但其實端到端的概念很早就有了,Waymo、Nvidia在很多年前都有發表相關論文。
很多人會以為Waymo現在的robotaxi不是使用端到端的技術,但實際上Waymo的前工程師跟阿財分享,Waymo設計了一些所謂的「特殊規則」這些rules在特殊情況下會在端到端上層的,例如:觀察到救護車消防車、車子被攻擊或發生車禍要撞哪個東西比較安全…大家可以發現,這些「特殊規則」除了救護車消防車之外,其實是很難定義或是描述清楚的,所以據說Waymo內部也是對此有所分歧,到底該不該設定這麼多「例外」凌駕於端到端上面?但從安全和各方商業的考量上來說,目前還是有設定這些以防萬一。
純視覺目前的精度上限是什麼?
就是LiDAR,因為目前訓練的標準答案就是拿光達的數據,而純視覺也非常難預測物體的速度,但用雷達就很簡單,這也是許多廠商直接選裝各種傳感器的原因,當然採訪中提到人其實不需要精確知道物體的速度也能開車,許多人會對光達有一點誤會,以為是自動駕駛專用,Lidar不只在自動駕駛上使用在測繪量測上都已經行之有年(甚至iPad pro上都有喔),而目前幾十公尺到百公尺的量測底下,光達精準且量測效率非常高,精度可以達到公分等級特殊應用甚至可以到mm等級。
所以工程上直接把光達當作真實物理世界的標準答案來看是沒問題的(光達中dToF的算法本質上跟雷射測距儀類似),一個不恰當的比喻,你拿尺量100公尺外一個車子的距離都不一定有光達準喔…有些人會說光達會有不同車輛干擾或受到環境(雨天雪天)產生的雜訊問題啊,目前有許多方法不管是從硬體上或從軟體上都在降低雜訊問題,真正光達比較麻煩的是大雨和大雪…但這個對相機來講更不友好,所以有雷達(不需要4D成像雷達)雷軍雷總很坦誠,小米就是因為純視覺沒有特斯拉好,所以才要使用光達,其實這真的是大實話,許多廠商因為算法數據等問題導致在純視覺上離特斯拉有一大段距離,所以直接上光達和雷達來補足這部分的差異。有點像是考試的時候有些好學生只需要普通計算機+手算就可以,但普通生因為沒那麼厲害,所以直接用工程計算機…但你不能說手算的會比工程計算機算的精準。
但這也引出了下一個問題...
為什麼純視覺端到端的方式目前很難通過監管?
實際上矽谷101中一位嘉賓也簡單的解答了,首先端到端目前還有很多黑盒子(不可解釋性的問題)另外目前L4以上的自動駕駛是沒有駕駛可以接管,所以對於監管單位來說,需要有更詳細的報告,目前已監管單位的角度是在探討小數點後幾位的事情,但特斯拉目前還沒到這個水準。監管單位對於整個系統的FIT(failure in time)還有其相關的冗餘備援等等考量,不管是系統層面或是算法的驗證層面都是有相關規範的,今天不是你說人類開車不需要想這麼多也能開就能避開的,這是兩件事情...
你可以問說那這樣的要求合不合理?反過來應該回去探討當初為什麼會定義這些要求?
絕對不是像網絡上有些人說的,那些都是過時的條文規定(實際上一直有在更新和找專家來研擬)雖然目前這些大家可能還沒有共識,但你可以很明白的比較,通過各種監管單位認證L4的waymo和特斯拉技術哪個強?採訪中特斯拉前AI工程師也明確說了,特斯拉是沒到waymo的水平,這是一個完全客觀的事實,之前阿財說得時候還有槓精跑來跟我抬槓…當然你從數據上也可以明顯看出差異(平均接管里程),如果現在特斯拉的技術已經趕上waymo那我們完全可以說純視覺已經成功了。
有趣的事情來了,那為什麼同樣用了光達雷達相機等傳感器,大多數的車廠沒有辦法做到waymo的水平甚至連特斯拉的純視覺水準都達不到?我覺得採訪中給出的答案:算法上的優勢只是其中一個關鍵,就像雖然許多大語言模型已經開源但chatGPT依然有他的優勢在裡面,有些人會猜數據不夠?時間不夠?算力不夠?
我認為光達雖然降低的後進們進入自動駕駛領域的門檻,但同時也把微調難度提高了一個層級,多模態多傳感器的算法很多,但能垂直整合的廠商不多,特斯拉車上只有相機而且車子自己生產,所以在調整上快速效率很高,而大多數提供解決方案的廠商本身不造車,像Nvidia雖然有提供解決方案,但車廠採購之後具體還是要針對車型進行調整,加上多傳感器的因素下,需要更高的算力和更多的時間去做算法的優化...而特斯拉純視覺的模式很適合拓展,不只是因為成本低,而是純視覺的端到端目前看起來佔用的算力不高,5年多前的HW3.0可以跑2024FSD的v12,要知道HW3.0的算力連一顆Nvidia的Orin都不如,而現在許多車廠因為算力需求搭載2顆Orin...另外有提到高精地圖,我相信大多數人也都認為高精地圖的模式很難拓展,我與Waymo的前員工聊了這個問題,他也表示在未來傳感器精度越來越高的時候,高精地圖中資訊佔比也會下降,慢慢降低高精地圖的依賴性,但還是不會完全不使用,因為很多地方路況很爛,高精地圖可以明確的給出各種有用且精確的座標訊息,據說Waymo馬上要開放在高速上的L4自動駕駛了非常值得期待!
而高精地圖成本非常高所以這會拉高門檻,但是Waymo因為背靠谷哥享受得天獨厚的優勢,谷哥地圖的團隊很早就開始建立大量的圖資數據,令我驚訝的是,高精地圖竟然也是圖資建立的一環,而谷哥之所以願意花費大量成本建制高精地圖根本的原因就是,它可以銷售圖資數據和廣告,所以對岸的百度/高德地圖也有這樣的優勢和商業模式...
講這麼多,我問了一個核心的關鍵問題,一直以來其實我沒有把Waymo放在與特斯拉同一個賽道之中,Waymo在無人計程車上是一個絕對的先行者也是技術領先者甚至是幫大家踩坑的肉盾(包含監管/法規/道德等社會觀)那Waymo會下放自己的L4技術給其他車廠嗎?答案出乎我意料,早就有車廠接洽了,只是沒談成,當然具體的原因比較複雜,不過我認爲這些車廠如果之後在自動駕駛領域嚴重落後,到最後買waymo的解決方案也不是不可能...但這有很多新的東西值得分享就不在這篇詳述了,大家就拭目以待!
Waymo自動駕駛比特斯拉自動駕駛好?
很多人會說waymo只能在特定範圍開,直接與特斯拉比較不公平之類的…這阿財當然知道直接比不公平,本來拿waymo跟目前的FSD比就是不太對,大多數做L4無人車的廠商拿到牌照進行車隊運行,它們並不認為自己正在做的東西和特斯拉自動駕駛是同賽道,甚至商業模式都不同。L4的自動駕駛技術一定比L2好嗎?很多人會有誤區,L3以上自動駕駛牽扯到的不只是技術問題,因為有無駕駛接管這件事情本身挑戰就是非常多,硬體軟體上的驗證、監管單位的要求等等…這些與L2都有很大的差異。舉個例子,waymo目前在特定範圍區域就是五檔的魯夫,穩定輸出實力超群,而特斯拉FSD有時候是5檔有時候是1檔…差異很大,這也是矽谷101那集有來賓有提到,他們測試V12的FSD,特斯拉有時候有L4的水準,有時候甚至L2都不如…但以目前特斯拉L2來說,不要求一直都是5檔,因為就算軟掉也有駕駛能接手,所以不管是硬體軟體對於監管上寬鬆很多。
Waymo去年的數據平均接管里程17000多英里約等於27000公里什麼概念?
北高可以來回35趟捏…即便如此也不是無窮大啊…任何系統都可能出問題,但27000多公里已經很恐怖了…(特斯拉目前是400多英里約700多公里北高一趟)我其實覺得waymo這類的無人計程車還不屬於這幾年的產品,我很難想像2024年的現在,一輛沒有駕駛的計程車可以在美國最繁華的城市之一營運…我認為科幻電影中,那種隨處可見的無人車,駕駛座無駕駛隨叫隨到的場景至少在近幾年很難讓大多數的人體驗到。
所以這幾天我和M觀點的M大有一個共識之一就是,我們認為L3就足夠了,至少可以在有限的路段可以放給自動駕駛開,我可以聽音樂看阿財的影片…而一年8000萬輛的市場,假設如我之前影片說的如果能有28%的車輛配有高階輔助駕駛,那每年將有2000萬輛車有這個功能,降低車禍風險的同時讓產業更進步。2000萬輛車假如特斯拉能有1/4~1/3的市場以目前FSD的定價來看也就5B~7B,說實在不多但想想每年都有6、700萬輛車的增速那也是相當可觀的!