本系列依然先說結論:
算力與能源仍然是推動 AI 發展最關鍵的資源,全球可能很快迎來新一輪的算力軍備競賽。但在短期內,所有企業與研究機構的首要目標,仍然是如何提升算力的使用效率,以降低 AI 訓練與推理的成本
最近,一些分析師認為 DeepSeek 的成功證明了「算力已經不再重要」,甚至有人大膽預測 英偉達 (NVIDIA) 將因 AI 訓練技術的變革而衰落,逐步喪失市場主導地位。這類言論雖然吸引眼球,但本質上是對 AI 產業運作模式的誤解,甚至可能在市場上引發不必要的恐慌
在這篇文章中,我們將拆解 DeepSeek 成功的關鍵因素,探討其技術的侷限。並討論這場技術變革為何不會讓算力需求下降、為何全球「算力軍備競賽」即將到來、及英偉達真正的隱憂是什麼?
DeepSeek 的階段性成功,並非因為它在人工智慧的前沿拓展了新的邊界,而是透過通過「模型壓縮技術」與「架構創新」專注於推理模型的最佳化,使 AI 在推理階段的效能更高、成本更低
相比於 OpenAI 或 Google 這類企業投入資源開發多模態模型,DeepSeek 選擇在當前階段放棄這條昂貴的道路,選擇優化現有技術使推理成本下降。然而,這種務實路線雖加速了商業落地的可能性,但其技術儲備是否足以支撐長期競爭仍需觀察
在 AI 的發展歷程中,企業通常扮演兩種角色:「探索者」與「追趕者」
探索者(Explorers)專注於研發新的 AI 架構與演算法,推動技術突破
例如 Transformer 的發明,開啟了大模型時代;Mixture of Experts(MoE)架構的興起,則提供了更具效率的 AI 訓練方式。然而,這類技術創新往往需要長期投入大量算力與資金,且不一定能立即轉化為市場回報,類似於基礎科學研究,可能需要數年甚至數十年才能發揮影響力
追趕者(Followers)則專注於基於現有技術進行優化,降低成本、提升效率,並加速商業落地
這類發展模式類似於階躍函數(Step Function):當一項新的技術突破出現,市場會迎來新一代的技術領先者。然而,一旦技術趨於成熟,追趕者的成本往往比探索者低 10 倍以上,因為他們無需承擔高昂的研發風險,而是專注於優化與應用現有技術。這就像一支車隊行駛在高速公路上,領頭車負責探索未知路徑、克服阻力,而後方的車輛則能順勢而行,享受更低的風阻與更穩定的行駛條件
以目前的發展來看,DeepSeek 顯然選擇了「追趕者」的策略
它沒有投入大量資源探索新架構,而是專注於如何讓推理過程更快、更節能,以極低的價格提供高效能的 AI 服務,進而衝擊市場。這種策略短期內能帶來競爭優勢,甚至可能改變 AI 產業的成本結構
然而,問題在於,當 AI 技術邁入下一個「階躍」時, DeepSeek 是否還能保持現在的競爭優勢?如果沒有足夠的技術儲備與創新能力,它可能會陷入成本競爭的紅海,而難以保持長期的市場領先地位。這將是DeepSeek 接下來面臨的最大挑戰
DeepSeek 在算力受限的情況下,依然能夠推出高度競爭力的 AI 模型,其核心優勢來自對推理成本的極致優化。雖然 DeepSeek 並未突破 AI 智能的技術邊界,但透過精細化的模型壓縮與架構調整,它成功降低了運算資源的需求,使 AI 推理變得更高效、更具成本優勢
這種策略雖不屬於顛覆性創新,卻已足以為市場帶來深遠影響。其中,最顯著的變革便是 AI 應用的本地化部署變得更可行
以手機為例,過去只有頂級旗艦機種才具備足夠的算力來支援高階 AI 助手,原因在於大模型的推理通常需要強大的硬體支持
然而,DeepSeek 的技術使 AI 推理變得更輕量化,這意味著未來即便是中階甚至入門級的設備,也能運行相對強大的 AI 應用。這不僅讓 AI 的普及度大幅提升,也將進一步推動行動裝置的智能化發展
這種趨勢不僅影響消費電子市場,也可能改變整個 AI 產業的研發方向
過去,許多 AI 公司的研發重心放在「如何訓練更大的模型」,但當推理效率成為競爭關鍵後,產業的焦點可能逐漸轉向「如何用更少的算力,實現更高效的 AI 推理」
當 AI 能夠在更低算力的設備上運行,應用場景的天花板將被推高
不僅是智慧型手機,邊緣運算設備、IoT(物聯網)裝置,甚至嵌入式系統也可能因此受益。這不僅加速 AI 的普及,更可能重塑未來 AI 技術的競爭格局,使那些擅長提升推理效率的企業在市場上占據更大優勢
星際之門計畫 (Project Stargate) 是 OpenAI 目前最具野心的研發項目,核心目標是透過大規模算力投入,在未來幾年內推動 AI 智能的突破。然而,隨著 DeepSeek 以不到 600 萬美元的成本迅速追趕 OpenAI,市場開始質疑算力是否真的關鍵?還是 OpenAI 在誇大需求,以合理化龐大的資金投入?
這場爭論的核心,來自於 AI 模型的發展路徑之爭
DeepSeek 的成功,主要來自於創新的模型架構與推理效率優化,使 AI 在執行時能以更低的算力需求完成相同的任務,進而大幅降低推理成本。然而,這類技術雖然提升了 AI 的可用性,卻並未真正推動 AI 智能的進化
DeepSeek 的成就不在讓 AI 變得「更聰明」,而是讓既有的 AI 變得「更便宜」
而OpenAI 的核心戰略建立在「湧現」(Emergence)理論上
過去的發展已多次證明這種現象的存在。例如,早期的 GPT-2 主要擅長生成連貫的文本,但當 OpenAI 擴大訓練數據量並提升參數規模後,GPT-3 突然展現出某種程度的邏輯推理與問題解決能力。而當 GPT-4 進一步擴展規模後,模型的多步推理能力、編程能力與跨領域理解力皆有顯著提升,這些能力在較小規模的模型中幾乎不可能出現
這種「湧現」類似於人類的頓悟,它並非線性增長的結果,而是規模達到某個臨界點後,突然產生的新行為。這也是為什麼 OpenAI 堅信唯有不斷擴大 AI 訓練規模,才能真正推動 AI 進化,而這背後的關鍵,就是幾乎無止境的算力需求
如果 OpenAI 的路線是正確的,那麼 AI 的進化確實需要不斷增加算力與數據,而我們也將進入一場永無止境的「算力軍備競賽」。然而,問題在於:沒有人能準確預測 AI 需要多少算力與數據,才能達到下一個智能突破點
這使得算力投資成為一場高風險的賽局。支持者認為,這是人類探索人工智能的必經之路。懷疑者則擔憂,這是否只是科技巨頭藉由資本與算力壟斷 AI 發展的手段?
但無論如何,隨著 AI 的能力不斷提升,人類對 AI 的探索慾望只會增強,算力與電力的需求也不可能窮盡
DeepSeek 的技術突破無疑對 AI 產業帶來衝擊,短期內甚至影響市場對英偉達的股價預期。當 DeepSeek 展現出更低成本的 AI 訓練與推理能力,投資者開始思考:英偉達的壟斷地位是否仍然穩固?
然而,AI 仍是一個增量市場,整體產業才剛剛起步。即便 DeepSeek 成功降低推理成本,AI 的應用場景仍在迅速擴展,整體算力需求不減反增。因此,只要 AI 的發展沒有停滯,英偉達的影響力就不會輕易消失
事實上英偉達的核心競爭力,不僅來自於其高效能 GPU,更來自於它經過十多年建立的完整 AI 生態系統
目前,全球絕大多數 AI 研究機構、企業和開發者都依賴英偉達的 #CUDA 平台。CUDA 不僅是一套驅動 GPU 的軟體,而是一個完整的開發環境,從模型訓練到部署都高度整合,讓 AI 研究者能夠高效開發並優化模型
這種生態系統的建立需要長時間的積累,並非僅靠更便宜或更快的硬體就能取代。事實上,在技術快速發展的時代,穩定的生態比單一的硬體效能更具決定性
舉個例子,微軟 Windows 長期稱霸 PC 市場,不只是因為它的作業系統強大,而是因為全球開發者早已習慣Windows 環境,形成了難以撼動的軟體生態。英偉達在 AI 領域的影響力,也類似於 Windows 在 PC 市場的地位
然而,這是否意味著英偉達可以高枕無憂?答案是否定的
英偉達的壟斷地位,建立在 AI 訓練對高效能 GPU 的依賴。但當 AI 技術趨於成熟,市場焦點將從「模型訓練」轉向「產品化」,這才是英偉達面臨的最大挑戰。隨著 AI 進入應用層面,許多企業將開始關注如何在更低成本、更高效能的環境下運行 AI。這將導致市場對專用 AI 晶片(ASIC) 的需求快速上升,例如:
這與智慧型手機市場的發展趨勢類似。過去手機晶片市場由高通(Qualcomm)主導,但當蘋果、三星、Google 等大廠陸續投入自研晶片後,高通的影響力逐漸被削弱
未來 AI 產業可能出現類似變化:
訓練研發階段,英偉達仍將是市場主導者,因為深度學習模型的訓練仍需要 GPU 提供高度彈性的運算能力。在推理與產品化階段,更多專用 ASIC 晶片將逐步取代 GPU,特別是在雲端 AI 服務、智慧手機、邊緣運算等領域
總而言之,英偉達的挑戰並非來自 DeepSeek 而是來自 AI 產業的長期演變。短期內,英偉達的生態與技術優勢仍然穩固,但當 AI 進入「產品化」時代,市場對高效能 GPU 的依賴將逐步減少,這才是英偉達真正需要面對的結構性變革