有人說「高不敢買,跌下來也不敢買」。有人說「AI 就跟 5G 一樣,騙局該結束了」。也有人回覆「我 100% NVDA,一股不賣,奇蹟自來」。
我把這三則並排看。三個人都在看價格——多的看「還會漲」,空的看「已經太貴」,信仰派連看都不看。
他們問的是同一個問題:輝達貴不貴?用的是同一套算法——本益比、營收成長率、跟 AMD 的市占比較。這是分析半導體公司的框架。
但輝達的 AI 晶片毛利率超過 90%。整體毛利率 75%,營業利益率超過 60%。蘋果 46%。英特爾全盛時期 60%。沒有一家賣硬體的公司接近 90%。
90% 毛利率是平台公司的數字。是 Visa 的數字,不是台積電的數字。
我用半導體的尺量這家公司,量到的是一個不存在的輝達。
用錯的框架算出的「太貴」或「還能漲」,結論都沒有意義。
這篇不告訴你該不該買。告訴你的是你量它的時候可能用錯了尺。
你以為護城河是晶片性能,其實是一套 4.75 億美元的軟體鎖
2007 年,輝達在聖塔克拉拉總部的停車場搭了一個帳篷,五十幾個華爾街分析師坐在折疊椅上吃三明治,一邊質問黃仁勳為什麼利潤率在下降。
他們問的全是短期數字。沒有人問他為什麼花了公司四年的研發預算去做一個叫 CUDA 的東西。
CUDA 不是一顆晶片。它是一整套讓 GPU 做通用計算的軟體平台。黃仁勳花了 4.75 億美元打造它,等於把公司三分之一的研發預算燒在一個當時幾乎沒人用的東西上。2007 年 CUDA 只有 13,000 次下載。華爾街的共識是這個平台的價值是「負數」。
輝達的硬體工程師也不高興。一個早期工程師後來回憶:「說服硬體設計師為什麼要為《毀滅戰士》的效能優化很容易,說服他們為什麼要為矩陣乘法優化就難多了。」
為什麼黃仁勳還是做了?因為 2003 年,一個叫 John Nickolls 的平行運算先驅寄了一封信給他,說摩爾定律因為電晶體的物理極限正在死亡,未來屬於平行計算。黃仁勳後來雇了他當 CUDA 的首席架構師。
CUDA 的關鍵決策是:不只放在專業卡上,放在每一張消費級顯示卡上。每個買 GeForce 打遊戲的人,都在不知不覺中補貼了 CUDA 的研發成本。內部叫它「CUDA 稅」。
這解決了軟體平台最大的問題:雞生蛋還是蛋生雞。因為每張遊戲卡都內建 CUDA,全世界的學生和研究員突然有了一台買得起的超級電腦。他們在上面寫的程式碼、建的模型、跑的實驗,全部依賴 CUDA 的函式庫。
到今天,CUDA 生態系有 300 到 500 萬開發者、300 個專業函式庫、3,700 個 GPU 加速應用程式。輝達自己有一萬個工程師專門維護這套軟體。
企業的資訊長面對的選擇是:繼續用 CUDA,還是重寫幾百萬行依賴 CUDA 函式庫的程式碼?答案很明顯。
這就是為什麼「護城河是 GPU 性能」是錯的。AMD 可以做出性能接近的 GPU。但 AMD 沒有 CUDA 生態。Google 可以做 TPU。但 TPU 上面沒有那 300 個函式庫。性能可以追,生態追不了。
Gurley 說護城河在縮小,輝達工程師說在擴大
輝達的工程師不斷重寫底層機器碼壓榨新一代晶片的效能,這些優化會自動回饋到整個 CUDA 生態,開源替代方案跟不上這個速度。一個硬體買家的說法是:輝達贏在軟體。電路追得上,軟體追不上。
你大概會覺得:那 4.75 億美元的軟體鎖,跑在每年都更強的 GPU 上,誰搬得走。
Bill Gurley 搬得走。他管 Benchmark,投過 Uber、Zillow。2024 年的 podcast 裡他拿出一個類比:CUDA 的故事讓他想起 2000 年代初期的企業軟體市場——當時 100% 的新創公司跑在 Oracle 資料庫和 Sun 伺服器上,五年之內全部換成了開源的 Linux 和 MySQL。
Gurley 的論點:開發者正在往堆疊的上層走。今天大部分 AI 開發用的是 PyTorch,不直接寫 CUDA。如果未來所有人都在 PyTorch 層工作,底下是輝達還是別家的晶片,就不重要了。
同一集 podcast,科技業高管 Sunny Madra 加重語氣:「CUDA 的護城河在推論市場不存在。」他指 Grok、Cerebras、SambaNova 在推論的性能和價格上已經超越輝達。
Gurley 這套說法的殺傷力在於:它不需要輝達做錯任何事——只需要開發者停止往底層深挖。
但黃仁勳自己反駁:輝達在推論市場的護城河反而更強。全世界的資料中心已經裝了大量輝達的舊晶片,CUDA 的向後相容讓這些舊晶片可以直接跑推論。
兩邊都聽完,我第一個反應是回頭問:他們在量同一件事嗎?
Gurley 量的是開發者往上層走的趨勢:誰在寫什麼。輝達工程師量的是底層優化的速度:誰跑得快。一個量時間軸的方向,一個量時間軸的斜率。兩個人根本在辯論不同的指標,你得先選你想賭的是哪一個。
然後 Stephen Witt 的書丟出一個讓兩邊都站不穩的東西。他在同一本書裡採訪了兩撥受訪者。一位前輝達研究員說切換 CUDA 是「巨大工程」,開發者試了通常決定「不值得」。另一位受訪者說,有時候「只要改幾行程式碼」就能從 CUDA 移到競爭對手的平台。
同一本書裡的矛盾。連採訪過輝達的人之間都沒有共識。
技術上可以切。商業上沒人敢。資訊長不會拿自己的職位去賭「可能只要改幾行」。這個膠著狀態撐得住的前提是沒有一家大客戶的自研晶片證明自己——哪一天證明了,水壩裂開不需要共識,只需要一個成功案例。
這篇分析還有5個章節:
- 為什麼輝達的 AI 晶片能收 90% 通行費 — 90% 毛利率不是硬體公司會有的數字。把輝達當 Visa 看的估值框架是什麼樣子
- 四個最大的客戶才是威脅 — Google/Meta/Amazon/Microsoft 一邊付通行費一邊修自己的路。囚徒困境什麼時候會打破?
- 你在同一條供應鏈上押了五次,你以為自己很分散 — 台灣投資人的持股表:50% 輝達、10% 台積電、40% VOO。算一下相關性在極端情境下趨近 1 的意思
- 2001 年光纖是對的技術,投資人拿回不到建設成本 10% — Perez 250 年歷史告訴你:建設期的結束不是慢慢減速,是突然停下來
- 你真正在賭的三件事 — CUDA 鎖定、AI 建設期、台灣地緣政治。三件事的順序不能亂,每件事都要自己定義「失效」長什麼樣
→ 完整分析(4 本書 + 5 個 podcast 的交叉比對)在讀角獸
讀角獸——帶著一個問題讀完所有英文來源,找出不同作者互相矛盾的地方,寫成有立場的判斷。更多主題 → ducorn.com




















