DeepSeek-R1 是中國公司深度求索(DeepSeek)於 2025 年 1 月 20 日發布的人工智慧大型語言模型,專注於數學、編碼和邏輯任務,在部分領域的性能已經比肩 OpenAI o1(圖1)。該模型聲稱以極低成本開發,以強化學習(Reinforcement Learning,RL)作為核心訓練方式,無需監督微調(Supervised Fine-Tuning,SFT)來達到降低成本的訓練手段而引發市場關注,導致市場對 AI 資本支出產生恐慌,並於 2025 年 1 月 27 日重挫輝達(Nvidia),使得單日股價暴跌 16.97%。
雖然DeepSeek的出現在短期內造成市場恐慌,但投資人應該注意的並非其低廉的開發成本所產生的衝擊,而是著重在DeepSeek如何使用其他開源模型,並且達到更高的訓練效率。DeepSeek產生的漩渦將激勵更多的中小企業探索開源模型的潛力,並且降低參與AI開發的門檻。此外,其高效訓練與優化效率的方式也將引發其他公司效仿,促進技術創新,持續降低API的訓練成本,使AI時代更快速的來臨。
本篇文章將聚焦於 DeepSeek 帶來的挑戰與機會。
DeepSeek 展示了低成本開發 AI 模型的可能性,導致市場對 CSP 業者的大量資本支出(Capex)產生疑慮。許多人認為,若可以透過低成本訓練出高性能的模型,是否就不需要投入過多費用購買高端 GPU ?然而,微軟(MSFT)與臉書(META)分別宣布 2025 年將投入 800 億與 650 億美元於 AI,顯示大型 CSP 業者仍期望透過大量的算力來產生更高性能的模型,藉此搶先取得通用人工智慧(AGI)的成果。
此外,DeepSeek 廉價的 API 成本(圖2)降低了 AI 參與門檻,使中小企業無需購買昂貴 的GPU(如 GB200、GB300),僅靠低算力GPU(如:H20或H100)即可營運。此趨勢可能帶動更多開源模型發展,推動更多中小型 AI 部署,反而進一步刺激 GPU 需求。這樣的推論可能符合 Jevons Paradox(圖3)(傑文斯悖論),意即成本減少導致需求增加,反而帶動整體算力需求成長。
(圖3)DeepSeek引爆了市場對於Jevons Paradox的討論
總結來說,DeepSeek 的出現雖短期內影響市場對 GPU 需求的信心,但長期來看,隨著AI的建置成本持續下降,可能帶動更多的企業願意投入AI產業加速企業產值。AI企業數量的增長更可能帶動總算力需求上升,進一步對於不同性能的GPU產生更高的需求。
AI PC 與 AI 手機是近兩年市場最為津津樂道的話題之一,但由於缺乏殺手級應用,消費者失去了對於AI設備可用於改善生活品質的想像,進而導致終端復甦仍非常緩慢(圖4)。然而,DeepSeek 的多樣參數模型與量化技術可能成為推動終端設備發展的契機。
(圖4)24年Q4電腦出貨量僅年增1.8%
DeepSeek 支援不同參數量級(7B、13B等),並具備動態調整與量化(4-bit/8-bit),可以壓縮浮點數精度以降低模型所需的記憶體與運算量,同時在精度損失極小的情況下保持原有性能,使得量化後的模型更加輕便,便於在資源有限的終端設備(如 AI 手機、AI PC、邊緣裝置)上部署。
便宜實惠的 Nvidia RTX 50 系列 GPU 預計將成為推動 AI PC 出貨量增長的契機,其強化的Tensor核心提供專門針對深度學習任務設計的加速器,能大幅提升 AI 模型訓練與推論的效率。而ASIC作為針對特定任務設計的專用硬體,具有高能效比、低功耗、低成本的特點,亦非常適合在終端設備上部署以訓練AI模型。
因此,隨著 AI 應用門檻下降,終端設備需求有望提升,有利於蘋果(Apple)、華碩(Asus)、戴爾(Dell)等品牌。投資人除了追蹤終端設備的復甦狀況外,亦可以關注相關零組件的供應商以找尋投資機會。
隨著更多低成本且高效的AI模型出現,預計將加速企業布置私有雲以運行模型,不僅能降低API訪問成本,也能提高數據安全性。舉例來說,金融、醫療甚至政府等對機密數據要求極高的行業,為了確保資料不外洩,往往會選擇在內部私有雲上運行模型,同時結合先進的AI監控系統進行安全防護,如網路入侵偵測、行為分析與數據加密技術,從而達到更高的安全標準。
此外,AI的訓練與推理需要高速讀寫與存儲資料,因此預計將帶動SSD或NVMe的需求;AI的訓練過程也可能使用到大量的歷史數據,為了減少空間成本,企業可能會使用冷儲存(Cold Storage)的方式存儲舊數據,以便未來重新使用,這可能也會帶動如磁帶機(LTO Tape)或大容量HDD的需求。
總結來說,企業部署私有雲不僅對存儲裝置需求產生正面影響,同時也可能促使伺服器硬體、網路設備、電源與散熱設備等相關產業受益,從而形成一個整體的生態系統效應。
隨著AI的持續發展,每個Token的費用也將持續下降(圖5),成本的下降將使 SaaS 企業受益,企業可用更便宜的AI價格來強化服務品質並降低人力成本。以下是部分 SaaS 企業的 AI 應用:
總結來說,隨著 AI 成本下降,SaaS 企業獲益。廣告優化(如 META)由於可以立即透過AI優化廣告投放策略,因此可於短期內受惠,但增速受高基期影響,而 IT 監控、AI Agent、數據流應用(如 NOW、CFLT)由於需要足夠的時間擴大企業滲透率,因此有長期增長潛力。
DeepSeek-R1 的出現,不僅以低成本高效能的特點顛覆了市場對 AI 模型開發的傳統認知,更以其創新技術和開源模式激發了整個產業生態系統的重構。從 GPU 資本支出的重新評估,到終端設備市場因量化技術驅動的復甦,再到資料存儲和 SaaS 模型的全面落地,DeepSeek 為各領域帶來了前所未有的變革契機。
儘管DeepSeek仍存在許多爭議(如:不正當方式蒸餾 OpenAI o1、隱含了更高的投入成本、隱私權及安全隱憂等),但它的誕生無疑正在引領 AI 產業進入一個成本更低、普及更廣的新時代。投資人與企業應密切關注這一動態,從中捕捉產業轉型與價值再造的寶貴機會。