想要第一時間獲得市場上的最新資訊及分析嗎?
歡迎點擊下方連結訂閱【馬克觀點MKP】電子報,在即時更新資訊的同時,獲得最深入的分析~
技術史上的每一次突圍,常常不是來自一個孤立的發現,而是源自於某種規律被看見、被量化,然後被用來做出理性的投入抉擇。

Waymo在今年6月13日發表了一篇短文,名為”New Insights for Scaling Laws in Autonomous Driving”,與其說它是一篇研究摘要,更像是技術指南針,指示了自駕領域的研發方向應是「如何用更多的資料、更多的算力,去買到更可靠的自動駕駛智慧」。換句話說,它把自駕世界裡長久模糊的直覺,證明為可預測的尺度法則。
我想先把最關鍵的事實放在眼前:Waymo用於研究的內部資料集達到約50萬小時的實際行車資料,並觀察到與近年大型語言模型領域類似的情況:當訓練算力、模型規模與資料量以一定比例放大時,運動預測(motion forecasting)和規劃(planning)的性能會以可預測的power-law(冪率,詳註一)方式提升。
這不是政客常談的「更大更好」的空泛口號,而是有數據、有曲線、能被用來做資源配置的實務結論。
讀這個結論時,有兩個直覺要被拆解。
第一,尺度法則在語言模型領域已被反覆驗證,但自駕系統涉及到動態交互、長期因果與安全性要求,情況看似更複雜;當把這個複雜的「場景互動」放進非常大的真實世界資料裡驗證,結果表明,即便面對道路上的不可預期與邊緣情形,「更多資料 + 更多算力」的組合,依然能帶來可量化的效力提升。換句話說,面對實際交通的混亂與人性的任性,統計規模仍然會把我們原以為不可預期的部分轉化為可學習的模式,進而改進AI的閉環(close loop)駕駛行為。
第二,則是關於部署的兩難:如果「大就是好」,那麼小公司、傳統車廠或新創如何競爭?Waymo 的研究也提供了實務方向:在推理(車載執行)階段,可以透過統計學上抽樣(sampling)、群集(clustering)或ensemble-distillation(即蒸餾技術,類似中國年初deepseek的原理)等技術,將大型模型的智慧萃取到較小、可跑在車輛端的模型上,使得實際落地的成本與延遲不至於完全被高資源門檻封鎖。
但他們也提醒:當模型與資料都放大到某個點,大模型在效率上會有反超優勢——也就是說,規模優勢會在某些情況下變成持續性的護城河,如特斯拉的FSD。這對行業競爭格局有長期影響。
對企業戰略與決策者而言,其實用價值在於「可預測的投資邏輯」。
發展AI的企業,其CEO可以自問三個關鍵問題:
- 要收多少資料回來才符合power-law預期的CP值?
- 訓練算力硬體投資和資料收集投資之間的比例應該如何調配?
- 在何時把模型壓縮到車輛端(走「邊緣運算」)、何時維持雲端推理(走「中央運算」)才是最佳折衷?
而實驗已經告訴我們,這些都不是靠直覺或感覺能決定的議題,而是可以用尺度曲線量化、預測並形成績效指標。
當然,任何尺度法則都不是萬能的護身符。
研究的外推性有其邊界:以Waymo的實際駕駛紀錄而言,除了數據量比它還多的特斯拉(估計至少3200萬小時的真實駕駛數據),其他公司若無法取得類似品質與多樣性的數據,單純靠公開資料或模擬可能無法復刻同等效果;單靠模擬的資料更須小心AI幻覺的情況,尤其是在自動駕駛的議題上。
此外,安全驗證、法規合規性與倫理考量,仍然要求在技術提升之外進行謹慎的制度設計,這些面向是Scaling Laws無法直接替代的管理命題。
這些不確定處,乃「實務上的外推風險」,會成為其他自駕競爭者在投入前需要做的嚴格成本效益與可獲取資料品質的評估。更大的可能性,是這些潛在競爭者(如傳統車企)在評估完後,可能會發現比起自己開發,通過付費取得FSD的使用授權可能會是成本效益更高的方式,這也會在將來形成特斯拉的營利模式之一;如同有些公司因為算力晶片的代價高昂,而選擇直接租用Nebius或CoreWeave 的服務等。
總之,Waymo此次的學術文章,把自駕的研發議題,從「靠人類工程師抓邊緣情況」的傳統戰場,拉回到一個可量化、可規劃的理性場域。對於想在自駕或未來機器人的agent AI領域採取行動的企業來說,現在的問題不是「要不要scale(規模化)」,而是「如何以最有效率的方式去scale,並同時建立把大模型能力安全落地到邊緣硬體(如車輛)的技術路徑」。
Waymo發布的這篇文章,雖沒講白,但某種程度上是自打嘴巴,意即它是間接承認「Level-5自駕的實現,還是得靠純視覺AI路線」,因為傳統感測器+HD map路徑,礙於成本高昂,是難以規模化的,而在AI時代,規模化的速度又將影響數據取得的速度從而反過來拖慢AI訓練的成效,這點從Waymo發展至今已經超過16年,但特斯拉不到3個月覆蓋面積就即將超越它便可略窺一二。
而其實waymo母公司Google在早年(2008~2009)也做過純視覺end to end自駕模型的開發嘗試,但因為沒有足夠巨量的真實駕駛視覺數據,所以宣告失敗,也因此讓他們在早期否認了純視覺自駕模型的可能性,因而導致長遠的技術路徑選擇錯誤,並且由於沉默成本效應,Waymo現在也幾乎不可能再回頭(就算回頭了真實數據也還是遠遠不夠),更何況特斯拉從FSD 13之後,還納入了道路聲音數據來做訓練,會在模型訓練上繼續跟對手拉開差距,畢竟人類開車本來就是眼觀四面、耳聽八方的,特斯拉的車不但有八個鏡頭,麥克風也從2018年式的一個,到現在依車型有2或3個。
如同Waymo該篇研究自述的,在訓練算力固定的情況下,要達最佳效果,模型參數量應以約1.5倍速度增長於資料量。而特斯拉FSD 14就將比FSD 13提升十倍的參數量,這是Waymo遠遠望塵莫及的。
故就像Mark在將近一年半前的一篇文章(也就是前一期)預言過的,「特斯拉會是有史以來第一家開發出L5的公司」
連特斯拉前AI工程師都表示:純視覺技術難!非常難!
但就如我一直信仰的一個道理「在這個世界上,能解決多大的問題,就能賺多少的錢」,賺多少錢就會反應在財報上,財報成績會反映到估值,股價長期而言又是跟著估值走的。
你唯一應該擔心的,是你在一家公司尚未爆發前,沒有買足足夠的籌碼(如同PLTR),但通常在那種爆發點尚未到來之前,單純從財報也很難看的出來,因為很可能就還沒開始賺錢,所以這時候,除非基本面質性分析做的足夠深入,你才有可能正確的買在爆發前,從而實現長期爆發式資本增長。這也是MKP想帶給大家的「硬核科技質性分析」的深度價值。
孫子兵法有云「兵馬未動,糧草先行」,即強大的後勤基礎是作戰衝鋒的基本,而Mark認為,任何的科技業也是這樣的,「技術先行」(非指技術分析的技術,是指硬底子科技技術,此處稍做澄清避免大家會錯意),否則根本不用期待後續會有什麼爆點,更甚者,沒有任何技術的股價增長,那我可以很肯定的告訴你,沒有別的,那就是泡沫!
Alphabet(GOOGL)在其財報裏,是把Waymo放在”other”這個項目裡的,因為它只是子公司,沒有獨立揭露營運細節的義務,根據實際情況推測,因為成本過高,Waymo很可能是賠錢的,也因此GOOGL把它放在other裡(other也還有其他的包在裡面)就可以去稀釋掉不利訊息。我現在比較希望的,是GOOGL能懸崖勒馬,放棄已經要輸掉而且不可能贏的戰場(導因於技術路徑錯誤),把這部分的資金、人力,轉回其真正賺錢的本業。
〖註一〗
所謂冪律,簡單講就是「input增加,output提升的速度」,通常畫出來是一條彎曲但穩定預測曲線;可以計算邊際效應(因到了某個規模,繼續加算力或數據的邊際效益會變小,但換言之,先「抵達終點」的人就有先行者優勢去搶占市場規模)