想要第一時間獲得市場上的最新資訊及分析嗎?
歡迎點擊下方連結訂閱【馬克觀點MKP】電子報,在即時更新資訊的同時,獲得最深入的分析~
近期,雖說AMD已經開始在AI推理晶片上發力,但NVDA也沒有少著墨,甚至可以說,從訓練到推理、模擬和網路,NVDA都佔有一席之地(而且是非常大的一席),首先在訓練及推理上,Blackwell架構GPU產品無疑還是非常優秀的(即便AMD聲稱單純論算力其已接近NVDA水準),在模擬方面,NVDA的數位孿生平台(註一)-Omniverse也非常優秀。
在過去,其實「模擬軟體」早已被半導體工程界大量運用,由於每一次改動都進行試做的成本太高,因此絕大多數會先進行電腦軟體模擬,而其中原理也不難懂,我們都知道,這世界是由各種物理公式組成的,半導體模擬軟體即是將各種物理公式(無論電學、電磁學、熱力學),在設定好的resolution(解析度)之下去做運行,理論上最佳的解析度會是精細到原子等級的模擬,但那實際上會消耗大量算力且不敷成本,所以實際上仍大多以物理世界可見尺度(如微米)來進行模擬,再以模擬結果與實驗/試作結果對比,來進行參數調教或其他設計的調整等。而這樣的模擬過往因為軟硬體的限制,基本上只存在於產品本身的尺度,無法「擴展」到整個產線甚至整個工廠,直到Omniverse出現!開創了宏觀物理世界中的「數位孿生」,甚至能進一步將之用於建廠或城市規劃前的模擬。

Omniverse 模擬畫面
結合該平台,商業客戶能將之用於數位化整個工廠、政府部門客戶能將之用於數位化整個城市,並以模擬數據推動人工智慧進行自我強化,以BMW為例,他們已在該平台上運行30多個虛擬工廠,以提前優化生產,而在自駕車方案,我們都知道特斯拉擁有最多物理世界的真實數據,雖然真實數據「必定」優於模擬數據(這是無庸置疑的,也因此FSD自駕系統在未來會是最強的,這點非常確定,詳情待以後有機會專文介紹特斯拉時為大家做拆解分析),但除了特斯拉以外的車企根本沒有這麼多海量的真實數據,因此退而求其次,Omniverse能夠在數位孿生世界合成的模擬駕駛數據便是這些車企所能仰賴的。其他領域亦有類似狀況。(但仍需注意AI幻覺問題,故前面才會說真實世界數據永遠是最佳的,這也是馬斯克為何堅持以實體數據來訓練FSD,因為在交通上,人命是不能開玩笑的)
隨著每個AI解決方案都需要越來越多的合成訓練數據,NVDA的解決方案形成了無與倫比的護城河。理想情況下,越多用戶、越多模擬數據的需求,最終亦是推動更多NVDA算力晶片需求的助推劑,因為前者的運算仍需要後者的硬體,這會形成一個正向回饋。
至少就我的觀點,NVDA仍處於AI價值鏈的中心。
而隨著資料傳輸與運算量的大幅上升,下一個要解決的瓶頸會是伺服器的頻寬問題,在這方面,NVDA已公開宣布與Astera(註二)在NVLink Fusion(註三)上的合作,可望能進一步打開更大的潛在市場規模。

截至今年七月,NVDA的估值與晶片業同行相比也不算貴(資料來源:seeking alpha)
〖註一〗
數位孿生(Digital Twin)就是把真實世界的一個物體、系統或流程,在電腦裡做出一個高度精準的「虛擬分身」。它不只是靜態模型,而是能即時接收感測器數據、模擬未來狀態,甚至預測問題。舉例來說,飛機引擎的數位孿生會同步監控溫度、震動等參數,讓工程師在它出故障前就能預判維修時機。
這技術在各領域都將成為關鍵,因為它讓我們得以先在虛擬世界測試與優化,再在真實世界落地,省錢、省時、降低風險。
但仍需注意「AI 幻覺」的風險,因為在模擬數位孿生的資料時,可能會在數據不足、模型偏差或邏輯漏洞下生成看似合理、實際卻錯誤的東西。這在工業、醫療或交通等高風險場景會很危險,一個錯誤的預測,可能導致維修延誤、誤判病情甚至安全事故。
〖註二〗
Astera Labs是許多公司在「人工智慧驅動資料中心(白話就是data center是powered by AI而有別於過往人工管理)」的策略合作夥伴。其強大的半導體產品專注於AI伺服器內部的連接組合,旨在解決下一代伺服器的頻寬問題,每款產品都經過獨特設計,可與其自家軟體平台緊密整合,這使得即時診斷和即時編程成為可能。
在伺服器傳輸解決方案上Astera Labs也是第一家推出第五代PCle重定時器(詳見註三)的公司,其市佔率達80%,並且目前正積極開發第六代;主要客戶包含NVDA、AMD、META、亞馬遜的AWS、Google和微軟。
〖註三〗
PCIe(Peripheral Component Interconnect express)就是大家熟知的SSD(固態硬碟)用於連接到主機板的接口之一(專有名詞叫匯流排)。
重定時器(Retimer)則為用來恢復+延長PCIe訊號傳輸距離的晶片;這裡先導入一個觀念,「訊噪比(SNR, Signal-to-Noise Ratio)」:訊號跟雜訊的比值,當訊號變小、雜訊不變時,SNR數值就下降,接收端就難以區分0和1(數位二進制訊號),造成錯誤率(專有名詞叫”誤碼率”)上升。
而尤其走線越長,訊號衰減越嚴重,接收端接收到的訊號潔淨度就降低,這時候就需要重定時器(Retimer)來重新生成數位化的乾淨訊號,打個比方就好像在很長的走廊裡傳話,如果只有兩端兩個人,那很容易越傳越小聲、雜音越多,最後聽不清楚,但若中間有第三個人當傳聲筒,他先聽清楚原話,再用正常音量、清晰發音繼續往下傳,就可以解決這問題,而此時他就相當於Retimer的腳色!
〖註四〗
NVLink Fusion是NVIDIA最新的高頻寬互連技術,專門用來把多顆GPU「融合」成一顆超級運算單元。
傳統多個GPU雖然可以合作,但資料必須繞過CPU或經過PCIe匯流排,延遲高、頻寬有限;NVLink Fusion則透過專用互連,把GPU彼此的記憶體與運算資源整合成單一「空間」,讓AI模型在多GPU間存取資料就像在同一張GPU上運行一樣順暢。這對超大型AI模型、科學模擬、Omniverse等需要龐大即時運算的工作特別關鍵,因為它能顯著降低延遲、提升資料吞吐量與平行處理效率。
簡單來說,NVLink Fusion就像把原本的多頭馬車,用韁繩綁在一起,使馬力集中沒有瓶頸,讓這台馬車(超級電腦與雲端AI平台)能跑得更快、更穩。