創辦人黃仁勳於今年6月11日在巴黎體育宮(Dôme de Paris)宣示,人形機器人有可能成為史上最大的產業之一。據他估計,一台人形機器人的成本可能約 10 萬美元,將來供工業或物流企業以租賃形式使用。他的估算高於多數分析師的預期,也更加合理,因為 NVIDIA 深知其元件與空間智能AI的實際成本。
「一切物理世界中的實體,都將先在數位世界中建構完成。」黃仁勳的願景很明確:持續加快各種可能與不可能發生的場景的模擬速度,讓機器人在真實世界中表現得更出色。這意味著市場將需購買更多NVIDIA的處理器與伺服器,來打造所謂的「AI 工廠」。黃仁勳宣布NVIDIA正在擴大全球技術中心的布局,特別是在芬蘭、德國、西班牙、義大利以及英國:「歐洲正在建造20座AI工廠。下一波人工智慧浪潮即將啟動。」
黃仁勳在活動上特別提到,其實NVIDIA創業是從法國開始的。事實上,NVIDIA的第一顆圖形晶NV1,最初是在美國加州設計,之後由當時的SGS Thomson(現為 STMicroelectronics,STM)在法國格勒諾布爾附近的Crolles工廠實現工業化製造。他回憶道:「1994 年時,全球只有這一家晶圓廠具備製造這顆晶片的能力。」
NVIDIA多年來一直是機器人領域中的重要一環,透過其Jetson 模組就能看出端倪。這模組像是電腦用的高效能顯示卡一樣,可直接連接機器人系統,大幅提升其內建運算能力,也因此帶來更強的分析、感知、避障能力,甚至可以更自然地與人互動。
憑藉在電玩領域累積的技術經驗——正如黃仁勳所說,這讓像《戰地風雲》(Battlefield)的戰鬥遊戲變得如此逼真——再加上對虛擬世界的優化,NVIDIA設計出一套極為精確的物理模擬器,用以模擬機器人在真實環境下的能力。不像現代遊戲那樣有「光線追蹤」、「高精細材質」和「體積光」等高階圖形技術,這種模擬器的畫面不在於追求華麗視覺效果,而是著重物理行為的精準模擬,例如機器人行走、碰撞、避障等動作。隨著AI加入,模型不斷進化,最終誕生了Isaac GR00T。

透過高速精準的模擬訓練,使過去屬於人類的行為逐步被機器人掌握。這場從人類社會邁向機器人時代的過渡,正悄然展開。
Isaac GR00T是一款為人形機器人設計的進階基礎模型,旨在透過模擬學習來泛化其技能。Isaac GR00T N1.5則是該模型的升級版本,整合了在模型架構設計與資訊建模方面的多項創新技術,使其能更有效地泛化學習結果,並提升對人類自然語言(無論語音或文字)的理解能力。此外,此模型特別針對各種操作任務進行最佳化,可應用於不同場景中,如桌面操作或工廠;也能透過後期訓練,如遠端操作,進一步調整以適應特定應用場景。值得一提的是,此模型的雙重認知架構,仿照人類推理模式,使機器人能夠自然且準確地感知、規劃並執行各種動作。
模擬訓練一開始是透過遠端操作進行——由全身配戴感測器的人類來示範動作邏輯,讓機器人學習我們人類的行為模式。接著,模型規模逐漸擴大,進入自我訓練階段,學習速度呈指數型增長,涵蓋了大量變化情境,例如不同的角度、光源條件,以及物體辨識。
透過結合模擬資料(Open Sim Data)和虛擬平台(Omniverse),搭載NVIDIA 晶片,NVIDIA建立出一個高度真實的虛擬環境,讓機器人可以在其中模擬學習、反覆訓練數千項過去僅屬於人類的技能:例如抓取突發物體、分類不同物品、穩定倒液體、開門、在街上行走⋯⋯透過遙控操作與生成式AI。每年技術的進步,都在不斷縮小模擬與現實之間的差距。
依黃仁勳之見,未來所有會移動的東西,最終都將由AI來操控。對他而言,「感知」是關鍵。他說:「機器人的鏡頭是透過光子來『看見』世界的。這就是我們打造 Omniverse 的原因——工廠與倉儲的數位對映必須達到寫實的視覺效果,才能讓機器人學會如何在其中移動。」
這些由模擬器生成的逼真的訓練資料,經過數百萬次測試,有助於提高人形機器人未來執行任務的可靠性。換句話說,機器學習的場景早已不只停留在研究實驗室,而是進一步走向可直接應用於機器人製造商的實務層面。就像是 Unreal Engine為遊戲開發者提供3D建構工具一樣,技術平台已備好,創作者和工作室只需要專注於劇情、風格和操作體驗。以往需要多年訓練才能掌握的技能,如今模型已經具備,彷彿我們將數年的實戰經驗下載到機器人的大腦中。
NVIDIA在汽車領域也採取了相同方法。其Cosmos模型包含了模擬生成的合成影像以及來自開源數據的真實駕駛影像,涵蓋不同街道和各種天氣條件,用來訓練自動駕駛車輛。系統會根據這些數據對駕駛表現進行評分,並與其他模型進行比較,包括行車軌跡、道路規則遵守程度,甚至面對突發狀況時的反應能力。換言之,這就像是一場針對 AI 的模擬駕駛競賽,以篩選出更安全、更可靠的自駕系統。

隨著AI模擬訓練與嵌入式安全系統的精進,在不遠的未來,自動駕駛很可能將不再是想像,而是街景的一部分。
這幾年來,NVIDIA開發一套名為Halos的內建安全自動駕駛系統。舉例來說,當車輛偵測到有行人、狗或貓穿越馬路時,便會自動減速。該平台提供一種整合式架構,從感測器(例如相機、LiDAR 光達)到計算模組,整體系統皆建構在嵌入式AI安全性之上。對於人形機器人來說,這套架構特別實用,因為未來它們必須能安全地在人類環境中運作——正如自駕車能夠在遇到行人或自行車時自動煞車一樣。
在主題演講期間,黃仁勳播放了一段影片,展示了兩家法國人形機器人公司:Enchanted Tools和Wandercraft,但他們研發的Miroki機器人及外骨骼機器人(exoskeleton)並未登台。現場唯一登台的機器人是BD-X,由迪士尼 Imagineering團隊為星際大戰主題樂園設計的小型雙足機器人。這台鴨型機器人經過大量虛擬訓練,在由3D模擬的滑動小球堆成的丘陵間反覆行走了數百萬次,訓練成效出乎意料地卓越。目前,BD-X已可在巴黎迪士尼樂園見到(影片:https://www.youtube.com/watch?v=VcXN1L8U8Pg),但尚未具備真正自主性,需由工作人員進行遠端操控。
是否有除了NVIDIA的其他選擇?首先,Intel過去一直是許多自主移動機器人與大型機器人的核心供應商,許多工業機器人都是使用Intel的CPU搭配其3D 攝影機RealSense。另一個替代選項是Qualcomm,其Snapdragon系列處理器主要用於Android手機,也被應用在較輕量的機器人上。例如Aldebaran Robotics 所推出的Plato機器人,就搭載了兩顆 Snapdragon處理器,使用的是Qualcomm的RB5系統模組。最終還是要回到成本的考量。NVIDIA的價格一向較其他競爭者高,可對於結構更複雜的機器人來說,NVIDIA的晶片目前仍然是最優選。
那麼中國機器人呢?中國工程師依然偏好使用包括NVIDIA在內的美國處理器。但未來可能會有變化,華為與小米等企業都在研發自家的本土晶片,小米甚至聘請 2500 名工程師打造自家的處理器「Xring 01」,未來可能從智慧型手機延伸應用到機器人領域。中國製機器人在人形機器人領域仍有可能大力採用 NVIDIA,讓其處於領先地位。
NVIDIA是否無可取代,現在評論還言之過早,但有一點是可以確定的:從高度擬真的模擬系統、強大的處理器、資料中心,到各項創新技術,NVIDIA 已成為全球機器人產業的關鍵推手。
Lexique professionnel 本篇文章出現的專業術語:
1. Une carte graphique:(n.f.) 顯示卡。
2. Un composant:(n.m.) 元件。
3. Une puce:(n.f.) 晶片/ 芯片。專用晶片是Puce dédiée, dédié動詞為dédier (v.t.) 獻給,貢獻。
4. L’intelligence artificielle spatiale: 空間智能AI,指 AI在空間感知、模擬或判斷方面的能力,簡稱IA spatiale。
5. L’intelligence embarquée: 嵌入式智慧/ 內建 AI。
6. Un processeur:(n.m.) 處理器。
7. Un serveur:(n.m.) 伺服器。
8. Un capteur:(n.m.) 感測器。
9. Un jumeau numérique:數位孿生/ 數位對映。
10. Un robot collaboratif:協作型機器人,專為與人類共同工作的機器人。也可直接用un cobot (英文collaborative robot的縮寫)。
11. Un robot humanoïde:人形機器人。
12. Un robot mobile autonome:自主移動機器人,具備自主導航與感測技術的移動設備,能在無軌道限制的環境穿梭自如的運作。英文是 autonomous mobile robot,簡稱AMR,法文會直接使用robot AMR來表示。
13. Une simulation virtuelle:虛擬模擬。
14. Des données synthétiques:合成資料,利用演算法、模擬器或生成模型(如 GAN、Omniverse、Isaac Sim 等)創造的虛擬數據。
15. La téléopération:遠端操控。
16. Entraîner un modèle:訓練模型。
本文節錄:
Nicolas Halftermeyer, « Jensen Huang veut donner un cerveau aux robots », in PLANÈTE ROBOTS N°92 Juillet/ Août 2025, pp.46-53