以下使用ChatGPT o1 Pro Mode,要求以克里斯汀生〈Clayton M. Christensen〉教授的口吻撰寫,基於破壞式創新理論(Disruptive Innovation Theory)進行分析。文中資料來源 REF01~04是我另外給予ChatGPT的。聽說黃仁勳最愛商管書就是克里斯汀生《創新的兩難》。但是,克里斯汀生已於2020年過世,那就只能透過GenAI呼喚英靈,來聽聽他「可能」的說法。
自我最初提出「破壞式創新」(Disruptive Innovation)以來,經歷了數十年的演進與實證。每當人們提及「破壞式創新」,總會聚焦在新進者如何能憑藉「看似不起眼或效率較低」的產品或服務,從邊緣市場切入,進而最終顛覆產業既有的領導廠商(Christensen, 1997)。在此脈絡下,我們需要回答一個重要問題:DeepSeek是否符合破壞式創新的關鍵條件,進而對現今AI領域的巨擘(例如Nvidia、OpenAI)構成真正威脅?若是,它威脅的核心又是什麼?
以下,我將透過破壞式創新理論常用的三大核心面向,分析DeepSeek:
最終,綜合探討DeepSeek究竟是否「破壞」了Nvidia與OpenAI所處的市場,以及此種「破壞」對這些領導業者的真正威脅在何處。
回顧我的原始研究(Christensen, 1997),新進者若要構成破壞,多半是從市場底層或尚未被滿足的非消費者族群開始。以硬體或晶片訓練為例,Nvidia的GPU(搭配CUDA)歷來以高效能、高價值著稱,主要針對雲端大型訓練、推論等高階客戶。有些研究者可能會問:DeepSeek的進場,究竟是「價格更便宜但性能較低」的做法,還是同樣強調「高性能」卻只是在特定面向強調效率?
若DeepSeek真的是從「低階」起家,理論上他們應該在極端成本意識形態下,針對一群被忽略的使用者或應用情境出發,提供「夠好就行」的推理或模型性能(Christensen & Raynor, 2003)。但據其公開資訊顯示,DeepSeek以「MoE(Mixture-of-Experts)、Distillation、8-bit量化」等方式,嘗試達成「高品質推理」與「低硬體成本」的平衡(#REF02; #REF04)。
一般來說,若DeepSeek可以在遠低於Nvidia最高階GPU的硬體投入下,還能夠提供足以吸引特定顧客的性能,那麼就可能呼應典型的破壞式創新邏輯:新進者以「便宜、高效率」搶佔部份客戶,既有廠商(例如GPU領導廠)暫時忽略此細分市場,直到後者壯大。
破壞式創新的另一種典型路徑,是所謂的新市場(new-market foothold),即目標先前不使用該產品或服務的非消費者(Christensen & Raynor, 2003)。DeepSeek是否創造了全新的應用範疇?
目前看來,DeepSeek主打的核心仍在「大型語言模型(LLM)之更有效推理與訓練」,這本質上並非全新的應用領域,而是對既有客群(需要大模型訓練與推論的用戶)的吸引。因此,它相較於「完全不需要GPU」的用戶,似乎並非在「完全新市場」攻城掠地,而較接近在既有領域中做「更節能、高效率」的進入(#REF04)。
若DeepSeek更進一步把目標用戶鎖定於「原本因為成本太高、買不起多張高階GPU的小公司或個人使用者」,那麼便有機會構成某種程度的新市場切入:即讓先前無法負擔昂貴AI算力的人,也能進行大模型訓練與推理。這會帶來一種「非消費者的消費化」契機(Adner, 2002)。
初步研判,DeepSeek的模式有潛力踩到破壞式創新的「邊緣市場」要素:即先吸引那些無力購置大規模GPU資源的應用單位。然而,它是否真的鎖定「被忽略的低階」或「新市場非消費者」,而非直接「正面挑戰高階GPU」、爭奪高階客群,尚需時間觀察。有些報導或技術解讀(#REF01; #REF03)顯示,他們同樣也瞄準高階算力場景,這就更接近「維持性創新」的正面對決。
在破壞式創新理論中,Nvidia持續累積對GPU硬體的「功能提升」,例如更高的FP16、BF16甚至FP8效率、更強的記憶體頻寬、以及CUDA生態系統不斷拓展的函式庫、工具(Christensen & Raynor, 2003)。這些強化對核心客戶而言非常必要,比如超大型雲端業者、頂尖研究機構,以及要求極致性能的應用。OpenAI則以龐大參數量及高階GPU資源,打造出ChatGPT等強勢應用。
這種「維持性創新」往往面向最挑剔、也是「利潤最高」的市場;隨著時間推進,可能出現「功能過剩」(overshoot)的情況,即市場開始過度供應,尤其對那些僅需要「夠用」性能的次級客戶而言(Christensen, 1997)。
DeepSeek若能在「夠用」的水準之上,再帶來顯著的成本或效率優勢,就會讓很多使用者發現:「Nvidia的頂尖GPU已遠超過我所需,我轉而選擇DeepSeek配置的低階GPU或特殊硬體,也能完成大部分任務。」此種情形便具破壞意味。
根據#REF04所提供的技術解讀,DeepSeek在大模型中使用MoE、Distillation、量化(8-bit或更低)等方法,再透過PTX層級的精細調度,成功繞過部分CUDA抽象層,取得更細緻的硬體指令控制(DeepSeek FAQ, #REF02; DeepSeek-R1, #REF03)。此舉有可能讓新進者在GPU市場中,找到一條與傳統「暴力硬體堆疊」迥異的性能提升曲線。
若如DeepSeek所言,其系統在不需最昂貴、最先進的GPU之下,仍可達到「主流顧客可接受」的效果,那麼就將誘使更多中階或中小型企業客戶在低階硬體上導入DeepSeek方案。這正是「破壞性軌跡」常見的做法:先在利潤率不佳的市場立足,但因為成本/效能比有吸引力,繼而逐漸進軍主流客戶(Christensen, 2006)。
然而,也需注意:有些案例中,新進者剛開始顯示出破壞潛力,卻最終未能向上攻佔高階主流市場(Markides, 2006)。要證實DeepSeek是否真能「往上攀升」,取決於能否滿足大規模雲端推論、複雜策略決策或沒有標準答案的高階應用。例如,目前資訊顯示(#REF01)DeepSeek R1適用於已有明確答案的推理,如程式撰寫、數學計算,但對「沒有既定答案」的情境思考、策略決策,尚難以競逐最前沿的巨量參數模型(DeepSeek FAQ, #REF02)。
這意味著:DeepSeek目前或許只適用於「特定類型推理」,仍未在全方位應用中表現出「完全替代」的破壞力。
依照我在研究磁碟機產業時的發現(Christensen & Bower, 1996),大公司往往聽從主要客戶、主要利潤來源之需求,資源持續灌注到「維持性創新」。對Nvidia來說,該公司投入可觀研發資金,擴充CUDA生態,並持續推出A100、H100、乃至未來更新一代的超高階GPU;OpenAI亦同樣投入大量算力、與微軟Azure深度綁定,這些都指向「更大規模,更大參數模型」的競賽。
這種「上層客群」為導向的投資,常讓既有業者忽略某些市場區隔(Kapoor & Klueter, 2015)。DeepSeek若能活用這點,在「相對小而更精準的市場」或「中層市場」提供一套高CP值的AI推理訓練流程,就可能逐步壯大,進而伺機挑戰主流應用(Gilbert, 2005)。
DeepSeek據稱在某些專案中釋出開源模型與技術細節(#REF03; #REF04),意圖讓更多中小型玩家採用,以此擴大生態圈。對照之下,Nvidia的CUDA雖然擁有龐大支持,但其核心仍為Nvidia自家硬體閉環為主,且對「如何高效利用第三方硬體」較沒興趣。
若DeepSeek長期能將其高效率技術,複製到各種通用GPU、甚至ASIC或NPU,便可能成為一種生態系統的雛形:既不依賴Nvidia,也能在一定性能水準上完成高端LLM需求。這種模式通常會撬動市場結構,從而顛覆既有業者的領先地位(Christensen et al., 2015)。
硬體銷售與生態優勢的衝擊:若DeepSeek持續證明其模型可在更低階或更少GPU資源下達成接近OpenAI的成效,許多企業就會傾向購買較低端的GPU或採用其他解決方案,導致Nvidia高階卡的需求受壓抑(#REF04)。
CUDA價值的稀釋:DeepSeek繞過CUDA抽象層,直接寫PTX指令獲得效能提升,顯示Nvidia長期以來的最大護城河——「完整且成熟的CUDA生態系」——開始受到挑戰。雖然PTX本身依舊屬於Nvidia生態,但若越來越多應用開發者直接使用底層指令,Nvidia在抽象層掌控力可能逐漸削弱(Raynor, 2011a)。
誘發Nvidia必須持續創新、改善「易用性與效能兼得」:面對DeepSeek,Nvidia恐需進一步改良CUDA的彈性,或釋放更多底層資源調度能力,否則部分高階客戶可能自行走PTX或其他路線。
模型訓練成本與市場定位:OpenAI的優勢在於大規模參數模型(如GPT-4)的領先,但若DeepSeek能以類似或只略低的品質,卻在硬體與資源需求上遠遠低於OpenAI,那麼OpenAI的「大規模硬體優勢」將被侵蝕。
新市場用戶的快速普及:OpenAI以雲端API等方式提供服務,主要面向大型企業、生態系統夥伴。DeepSeek若可透過開放模型、相對廉價的部署,快速讓中小企業或個體開發者取得可用的大模型能力,就可能在「主流使用者尚未覺察時」累積龐大的用戶基礎並向上滲透(Adner & Zemsky, 2006)。
破壞式創新的典型動能:針對非消費者與「不那麼高標的客戶」:對OpenAI而言,這群客戶過去或許被視為「利潤不高」或「使用量有限」,但若DeepSeek在這裡建立起自己的生態,一旦品質再提升,就會壓迫OpenAI的核心市場。
最終,若DeepSeek真能在「更少資源、更低GPU成本」卻提供「可與主流市場需求匹敵的語言模型」上崛起,那便正中破壞式創新要害——即既有大廠一開始並未充分重視的市場區隔,往往是改變產業秩序的策源地。未來仍需觀察DeepSeek能否「順利攻頂」,或者只是在特定細分市場裡找到定位。理論上,他們的道路或許艱難,但這正是破壞式創新能量真正釋放的典型場景。
附註
#REF01, #REF02, #REF03, #REF04 引述自題示提供之資訊,用以輔助完整脈絡。引文中提及DeepSeek技術、PTX指令、MoE架構等,參考了上述連結資料及公開討論。 以上分析為本人(Christensen教授風格)綜合破壞式創新理論及現有資料之探討,尚需後續實證與觀察驗證。
總而言之,DeepSeek若能持續證明在「不需頂尖GPU硬體」也能達成大模型主流應用的「夠好」表現,就可能引發「破壞式創新」的典型路徑。對OpenAI來說,重要威脅在於中小型市場與日益增長的開源生態;對Nvidia而言,其硬體銷售與CUDA生態的既有護城河恐被部分稀釋或逼迫更快革新。這一切,正是「破壞式創新」理論長期所揭示的:最具潛力的挑戰,多半來自一開始並不被主流關注的「效率」、「成本」與「次要客戶」市場。而一旦這股力量找到了通往核心市場的可行途徑,往往足以重新定義整個產業秩序。