隨著 DeepSeek 和 OpenAI 的推理模型(Reasoning AI)崛起,市場對人工智慧(AI)投資的重點正從基礎建設(如資料中心與晶片)轉向推理運算(Inference),並推動 AI 整體支出增長。根據 Bloomberg Intelligence 的最新預測,亞馬遜、Meta 和微軟等超大規模科技公司在 AI 方面的投資增長速度將超過先前預期,主要資金將用於運行 AI 模型(推理),而非傳統的模型訓練。預計 2025 年這些科技巨頭將在數據中心與運算資源上投資 3,710 億美元,較 2024 年增長 44%,並在 2032 年進一步增至 5,250 億美元。到 2032 年,AI 支出的近 50% 將用於推理運算,而 AI 訓練的資金占比則將從 40% 降至 14%。
這一變化主要受到 DeepSeek 模型的影響,該模型於 2025 年 1 月推出,在效能上可匹敵 OpenAI 和 Google 所提供的頂級模型,但成本僅為其一小部分,且使用更少的 Nvidia GPU硬體算力,因而顛覆了市場對 AI 基礎設施投資的需求。其中Meta 的執行長馬克·祖克柏在財報電話會議上也提到,美國 AI 產業正逐步轉向 AI 處理(推理),顯示市場對這類技術的高度關注。另一方面,OpenAI 也加快步伐,於 2025 年 2 月推出「最具成本效益」的推理 AI 模型 o3-mini,該模型在數學、科學和程式設計等領域表現優異,並提供低、中、高三種推理層級,以應對不同複雜程度的任務。這些發展顯示,推理運算比起模型訓練更能直接為企業帶來價值,無論是在智能客服、推薦系統或商業決策等應用上,都將使 AI 成為更強大的商業工具。由於推理運算的成本正在下降,企業將更積極導入 AI 技術,以提升競爭力並開發新的商業模式。
這些觀點與目前在國內所看到的趨勢基本一致,DeepSeek的出現不僅只是所謂的人工智慧所需的算力成本急速降低,同時衍生的問題是透過某程度的資料串接或資料蒸餾,很有可能可以用很低的算力建置去取得一個客製化的自有專家模型,從而降低了每個組織或企業有自有語言模型的可能性。
而且是否有持續的語言資料可以被用於訓練也是一個值得懷疑的問題,可以說某程度上,如果沒有意外,基於語言模型的算力需求與應用在可見的未來應該是持續降低的。考慮到資料量的龐大性,未來生成式AI的算力模型有可能會從語言轉向到其他更有規模化資料需求的領域,例如化學、材料、生醫研發。