當特斯拉(Tesla)公布其2025年第三季財報時,市場的焦點不再是單純的交車量或利潤率。Elon Musk拋出了一顆震撼彈:
特斯拉目標在2025年底前,於奧斯丁(Austin)大部分地區移除FSD的監督員
這不僅是口頭上的宣示,更代表特斯拉將正式邁入L4等級的自動駕駛商業營運。這項宣示,以及近期特斯拉人工智慧副總裁Ashok Elluswamy的深入技術演講,共同揭示了一個清晰的未來:特斯拉的終極目標,從來都不是只做一家汽車公司,而是要成為全球最頂尖的「現實世界人工智慧」公司。
今天,MKP將綜合分析所有近期的關鍵資訊,深入挖掘FSD、AI5晶片以及Optimus機器人背後,令人嘆為觀止(非單純誇飾吹捧用語)的技術細節與戰略佈局。
想要第一時間獲得市場上的最新資訊及分析嗎?
歡迎點擊下方連結訂閱【馬克觀點MKP】電子報,在即時更新資訊的同時,獲得最深入的分析~
【L4的臨門一腳:信心驅動的產能擴張】
馬斯克在財報會議上,用「100%確信」這樣的字眼來形容FSD未來的安全性將「遠遠超越」人類駕駛;這份絕對的自信,是理解特斯拉當前所有戰略的關鍵。
傳統車廠的邏輯是「先有需求,再生產」。
但馬斯克現在反其道而行,宣布將大幅擴張產能。
為何在RoboTaxi尚未獲利前就瘋狂擴產?答案是,馬斯克已將L4視為既定事實。一旦FSD移除監督員,每輛車都能每周七天/24小時運行並創造營收,市場對車輛的「需求」將不再是交通工具,而是「會賺錢的資產」,需求有可能在短時間內拉升。
然而,這一切的豪情壯志,都必須建立在一個問題上:特斯拉的AI究竟是如何做到的?Ashok的技術解析,為我們揭開了FSD的黑盒子。
【FSD的大腦革命:從「手寫規則」到「E2E AI」 】
Ashok指出,傳統的自動駕駛系統為「模組化」;工程師將任務拆解為:
- 感知(Perception):辨識車輛、行人、交通號誌。
- 計畫(Planning):決定該左轉、直行或剎車。
- 控制(Control):實際操作方向盤和踏板。
以上傳統系統的致命缺陷在於,它依賴人類工程師「手寫程式碼」來應對所有情況,但現實世界其實是「邊緣情境(Edge Cases)」的無限集合。Ashok舉了兩個他們遇到的絕佳真實世界案例:
- 水坑:FSD遇到一個大水坑。它該逆向繞過,還是減速駛過?如果逆向車道50公尺外有車呢?100公尺呢?水坑多深?你無法用 if...then... 等程式語言寫完所有可能。
- 雞與鵝:FSD遇到一群「雞」過馬路,它會耐心等待最後一隻落單的雞也通過;但在另一個場景,它遇到一群在路邊的「鵝」,卻能判斷它們「沒有過馬路的意圖」,而直接駛過。(我就問,目前還有其他哪家公司能做到?沒讓動物死於陸殺就不錯了)
這種近乎「讀懂意圖」的能力,恰是人工手寫程式碼做不到的絕對罩門。為此,特斯拉推翻了舊架構,轉向「端到端AI」—不再有人為的模組劃分,而是讓一個龐大的神經網路,直接觀看攝影機的原始影片(input),然後直接輸出方向盤和踏板的指令(output)。
〖解決端到端AI的挑戰:特斯拉的「數據引擎」〗
但當初要開發端到端AI也不是那麼容易,兩大挑戰在於:
- 資訊維度詛咒:FSD需在瞬間處理8個攝影機過去30秒的數據,這構成高達20億個資訊點(information points)。
- 虛假關聯(False Correlation):在海量數據中,AI可能學到錯誤的邏輯。例如,AI發現「下雨」和「剎車」總是一起發生(因為人類在雨天會開得較謹慎,點剎機率增加),AI可能會錯誤推論出「下雨本身就是剎車的理由」,而不是「雨天路滑」這個真正的因果關係。
特斯拉解決上述困難的答案,是其獨步全球的「數據引擎(Data Engine)」。這不僅僅是「大數據」,而是一套高效、自動化的「邊緣數據挖掘系統」。
早在傳統車廠還在用昂貴的測試車隊上路收集數據時,特斯拉就利用其全球數百萬台車輛組成的「車隊」,建立了一個closed-loop,包括:
- 被動收集:當FSD遇到困惑點,或駕駛接管時,系統會自動標記該片段。
- 主動狩獵:特斯拉甚至可以在車隊的電腦中植入「小型神經網路」,主動「狩獵」特定的稀有場景。例如,特斯拉總部想研究「大雨天,對向車道有車打滑」的場景,他們可以向全球車隊發送這個「狩獵任務」,在幾天內就收集到數千個高品質、且稀有的真實邊緣數據。
利用相對大量(註一)的這種高品質數據所進行的訓練,讓FSD擁有了「預判能力」。
Ashok也展示了一個震撼的案例:FSD在一條微濕的路上跟車,在影片第5秒,前車的車頭僅僅「歪斜了幾度」,FSD就在碰撞發生前精準執行了適當力度的剎車而提前避免了事故。
FSD的判斷是:「路面微濕+前車不尋常的微小偏離=高機率打滑並撞擊護欄後反彈」。這就是AI從海量真實數據中學到的,超越人類反應極限的「預判」。(但很多空頭仍不相信,甚至也不願意去研究技術;ok it’s fine.)
【解鎖黑盒子:「高斯建模」與「虛擬世界模型」】
端到端(end to end, E2E)AI雖然強大,卻像個「黑盒子」,你很難知道它在想什麼。為此,特斯拉開發了兩套堪稱「黑科技」的除錯與測試工具:
- 高斯建模(Gaussian Splatting) 3D重建
當FSD犯錯時,工程師如何除錯?
- 傳統方式:查看程式碼(但E2E沒有傳統定義的程式碼可查)。
- 特斯拉的方式:
- 自然語言詢問:工程師可以直接用文字問AI (FSD):「你為什麼闖紅燈?」AI可能會回答:「我沒看清楚,紅燈被一輛卡車擋住了。」
- 3D虛擬重建:更強大的是,特斯拉開發了一套基於高斯建模的系統,能將FSD犯錯瞬間的2D影片數據,「重建」成一個完整的3D虛擬世界;工程師可以像玩遊戲一樣,用「上帝視角」在3D場景中飛行,從任何角度(甚至車頂、路口對面)去觀察當時車輛的動態,精確找出問題所在。
Ashok也特別強調,傳統高斯建模渲染一幀畫面需要30分鐘,而特斯拉的版本僅需0.22秒,實現了幾乎是即時的3D重建。
- 「閉環」的世界模型(World Model Simulator)
如果說3D重建是「回放過去」,那麼「世界模型」就是「創造(逼近真實的)未來」。
特斯拉能將那些極度稀有的真實邊緣案例(例如澳洲的隕石擊中案例、加州的輕航機擦身迫降案例),在模擬器中100%複製,建立一個「電影級」、逼近真實的虛擬世界。整體概念跟我們以前介紹過的數位孿生很像。
這個虛擬世界不是預先編碼的,而是由真實數據所生成。這讓特斯拉可以:
- 重現與修改:讓FSD在這個虛擬世界中反覆重試「飛機迫降」的閃避場景。甚至可以修改參數:「如果飛機角度偏10度?」「如果當時下大雪?」
- 強化學習:讓AI自己在這個hyper-realistic(超逼真)的虛擬世界中「玩」數百萬次,直到它自己找到應對這種極端情況的最佳策略。
這就是特斯拉的「閉環(closed-loop)測試」系統—從真實世界收集數據,在虛擬世界訓練AI,再將更強的AI部署回真實世界。
而特斯拉對於發展FSD龐大的野心,必須有強大的硬體支撐。這就是AI 5晶片(Hardware 5)的由來;簡而言之,AI 5晶片是特斯拉為AI的「mind」量身打造的硬體,並預計在2027年量產。
馬斯克在Q3財報會議中提到,AI 5相比AI 4,在某些性能上將提升40倍。
特斯拉的AI晶片之所以能效比(每瓦效能)贏過他廠的通用晶片,關鍵在於如同ASIC的「客製化」與「刪減」非必要部分,舉例如:
- 刪除影像信號處理器(ISP):ISP的作用是將鏡頭傳來的原始數據,調整白平衡、曝光、降噪,變成一張讓人類肉眼覺得「漂亮」的照片,這在智慧型手機上是必要;但AI不需要「漂亮」,需要的是「真實」而原始的光線數據。特斯拉在晶片設計上大膽刪除了ISP,讓AI直接生吃最原始的數據,這極大降低了延遲和功耗。
- 刪除GPU:通用GPU為了遊戲和渲染,內建了大量AI訓練不需要的功能。特斯拉將其刪除,把寶貴的晶片面積全部用於AI運算。
- 優化數據傳輸:特斯拉明確知道其軟體運行過程中,每個硬體邏輯模組之間需要多大的數據傳輸量;這讓他們可以像城市規劃一樣,精確設計數據「高速公路」的寬度(就是頻寬),既不浪費(太寬)也不堵塞(太窄)。
最終,特斯拉打造出了「成本僅為同行的十分之一」,但效率卻高出數倍的專用AI推理晶片。
【Optimus機器人與特斯拉AI之間的擴展性】
如果FSD是特斯拉AI系統的第一個應用,那麼Optimus機器人就是第二個。
Ashok在技術演講的最後,明確指出FSD的整套AI架構(E2E、數據引擎、世界模型、強化學習),可以完美「擴展」到Optimus的應用。
如果FSD的「世界模型」是「道路」
那Optimus的「世界模型」就是「工廠」或「倉儲物流」、「家居」等
機器人的AI model可以透過觀看人類影片來學習,然後在虛擬世界中進行數百萬次沒有安全疑慮、不怕犯錯的練習,最後再部署到現實中。
馬斯克在Q3財報中宣布,外觀預計朝向擬真化設計的第三代Optimus將於2026年第一季亮相;他也直接指出,機器人領域未來最大的難點之一會是「生產」。
雖然其他新創公司(如Figure AI、Agility Robotics、Unitree Robotics和XPENG等)並非完全沒有能力規模化生產機器人所需的客製化馬達、致動器(Actuator)和類人手部,但特斯拉,這家每年生產數百萬輛電動車、全球最大的「電機生產商」,在供應鏈和規模化製造上,已擁有相當程度的先行者優勢(製造經驗、產能)。
在馬斯克先前的採訪中,他也發出聲明:
如果股東不支持他的新薪酬計畫(給予他更多的投票權),他將「不會在特斯拉發展大規模的機器人」
這不僅是薪酬問題,更是控制權問題;馬斯克擔心的是,在他實現AI願景的過程中,會被那些只看重短期財報的激進投資機構干擾甚至罷免(而這也是其一直未將Space X公開上市的原因,因大部分機構通常只看中實質財報表現,無法忍受中短期經營的波動,而太空事業在馬斯克看來不是短期投資者能投資的)。
所幸,近日股東大會中,此薪酬案以高達75%的支持率高票通過!
綜合來看,特斯拉正在下一盤前所未有的大棋。
它以FSD為起始,打造了一套從「數據收集」、「AI 訓練」、「數位孿生模擬」到自研「客製化晶片」的完美閉環;這套系統正以相當快的速度自我進化,而RoboTaxi和Optimus機器人,將是這套系統收割利潤的最終形態。
在去年,Mark還認為L5的實現需要十年以上,但光從特斯拉目前已經近乎攻克自動駕駛這點來看,其AI技術護城河,或許早已深不見底。
〖註一〗
因邊緣事件跟每日行車總數據比起,算是罕見數據,相對大量是指其他車廠因為樣本數不足,而非常難以獲得此類罕見,卻跟行車安全有絕對關係的數據。
而以特斯拉的統計數據,其全球總車輛每天提供「500年份的駕駛數據」,並從中以智慧觸發方式捕捉(hunting)他們要的邊緣案例。
















