Pre-training as we know it will unquestionably end.
Compute is growing: Better hardware/Better algorithms/Large clusters
Data is not growing: We have but one internet/The fossil fuel of AI
Ilya Sutskever
Ilya Sutskever,前 OpenAI 首席科學家,在去年底的一次演說中提到,當前 AI 模型的預訓練模式——以數據與參數規模不斷擴大的 Scaling 模式——即將接近尾聲。雖然算力仍在快速增長,但資料如同石油化石燃料,已經接近枯竭。這番言論引發了市場的巨大討論,許多人擔心 AI 的發展是否已經到了盡頭。
回顧 OpenAI 的發展歷程,從 2018 年推出 GPT-1(1.17 億參數),到 2019 年的 GPT-2(15 億參數)、2020 年的 GPT-3(175 億參數),再到 2023 年的 GPT-4(推測達 1.7 兆參數),一路採用了透過增加參數與數據規模來提升性能的路徑。然而,這種模式如今似乎已到極限。自 GPT-4 後,至今未見 GPT-5 或 Orion 推出,反映出 Scaling 模式的瓶頸逐漸顯現。
相對於以往的增長模式,OpenAI 在 2024 年推出了 Test Time Compute 的 O 系列推理模型,這類模型就像是《快思慢想》(Thinking, Fast and Slow)中的系統二,能夠進行更慢、更深度的推理,解決更複雜的生活問題,而原先的 LLM 是屬於系統一可以快速、直覺回答問題。去年底 Google 推出 Gemini 2.0 Flash Thinking 一樣是朝這個方向,Anthropic 也會在今年推出他的 reasoning model,這表明,未來的 AI 發展可能會更多地依賴於其他方向的創新方法,而不是單純追求模型的規模擴張。
Ilya Sutskever 在演說中也提到,AI 的未來發展將聚焦以下三個方向:
因此,在探討 AI 的發展與投資方向時,我們不需要過於擔憂網路上的文字資料即將耗盡的問題。半導體分析公司 Semi Analysis 創辦人 Dylan Patel 在 BG2 Podcast 的訪談中提到,許多影片資料目前尚未被用於訓練,而 Synthetic Data(合成數據)的發展才剛起步。合成數據需要透過模型運算生成,以模型訓練模型,而 reasoning model(推理模型)的 inference time compute(推理階段計算)仍然依賴大量算力支持。
微軟在幾天前也宣布,將在 2025 財務會計年度持續投入 800 億美元建設資料中心,各大科技巨頭在 AI 資料中心的建設競賽中依然激烈,相關基礎設施需求仍有持續的成長空間。
對於 AI 的投資機會,我們可以從三個層次進行分析發掘:基礎建設、模型層級與應用層級。
1. 基礎建設:AI 技術的支柱
上一次回顧去年2024年度漲幅發現 AI 基礎建設相關公司得到不錯的報酬, AI 大量應用帶動了從晶片設計、晶圓製造封測、半導體設備、半導體材料、HBM 記憶體、網通、資料中心基礎設備(如散熱冷卻、電源、機櫃),甚至是資料中心土地、水電、能源公司。還有軟體方面的基礎建設,雲端資料中心/資料數據平台建立/資料整合分析/資安/模型訓練服務等全面需求,2025年應該都還能持續成長。
2. 模型層級:技術創新的核心
中間模型層級,OpenAI(GPT 系列)、 Anthropic (Claude) 、Google (Gemini)、Meta (Llama)、xAI (Grok)、Amazon (Nova)、法國公司 Mistral、中國 DeepSeek 等企業的模型技術競爭日益激烈。對於一般投資者,實際投資層面,如果想直接投資參與大模型 AGI 競爭,目前最容易還是投資其母公司(Microsoft、Alphabet、Meta、Amazon)。
3. 應用層級:市場價值的放大器
AI Agent 是未來 AI 的主要應用方向之一。在軟體工程方面,像是 Github copilot/Cursor 輔助 coding 工具,到像 Cognition AI 的 Devin 公司目標是想直接取代軟體工程師幫我們完成專案任務。去年,Anthropic 的 "Computer Use" 和 Google Chrome 的 "Browser Use" 功能,可以看作是 AI Agent 發展的初步嘗試。雖然目前這些功能主要透過圖形化界面(GUI)實現自動化,但這應該只是階段性過渡。畢竟,GUI 是為人類使用而設計,而程式之間的自動化操作未來仍會更多地依賴 API 的串接方式,這樣不僅更加簡單快速,也更具可靠性。特斯拉的 FSD 正是展示出 AI Agent 在實際生活應用中的案例,它通過取代人類駕駛,不僅能解放開車通勤時間,還能提供更高的行車安全性。
AI 應用層的新創公司多數仍集中在一級市場,一般投資者難以像風險投資(VC)那樣分散投資於多家公司,並期待其中一兩家能帶來超額回報。不過在次級市場中,我們仍可以尋找潛力公司進行分散投資,但其實大多數情況下,投資科技巨頭仍是參與 AI 浪潮的主要途徑,因為 AI 新創公司要生存下去真的不容易。
以 Adept 為例,其創辦人 David Luan 是 OpenAI 的創始成員之一。他與團隊開發的 ACT-1 模型,旨在讓 AI 與各類軟體和應用程式無縫協作,幫助用戶完成所有工作,這正是實現 AI Agent 的願景。然而,AI 新創公司不僅需要探索應用場景,還需自行研發大型模型,這對資金需求極為龐大。去年 6 月,Adept 已被亞馬遜以收購式聘僱的方式吸納其核心人才。
類似的收購案例還包括亞馬遜對 Covariant(專注於電商倉庫和配送中心的機器人自動化公司)的收購。Google 也通過收購式聘僱將 Character AI 的核心人才整合至其 Gemini AI 項目。微軟則延攬了 Inflection AI 的重要人才,進一步加強自身在 AI 領域的競爭力。
此外,AI 新創公司 Perplexity 專注於 AI Search 應用,其基礎模型支持多種選擇(如 Claude 3.5 Sonnet/Haiku、ChatGPT 4o/o1 和 xAI Grok2等),但同樣面臨來自大模型公司(如 GPT Search)以及傳統 Google Search 在轉型過程中的激烈競爭。
在分析 AI 的投資機會時,可以從基礎建設、模型開發和應用層三個方向尋找相關公司。而 AI 的發展依賴於三大關鍵因素:數據、演算法(可視為人才)、以及算力(如自有資料中心)。大型科技巨頭通常在這三個層級均有布局,並涵蓋基礎設施、模型研發和應用層面的多重領域,只是可能各自深度不一樣,應用方式不同,算是投資 AI 的穩健選擇。
AI 的發展雖然看似面臨 Scaling 模式的瓶頸,但在 Agent、Synthetic Data 和 Inference Time Compute 等創新方向上仍充滿潛力。無論是基礎建設、模型還是應用層面,科技巨頭們都展現出全面布局的能力。未來,投資者應根據自身風險偏好,結合市場的長期趨勢,選擇適合的投資標的,從而更好地參與這場技術革命。對於普通投資者而言,持續買進,長期持有科技巨頭的股票,參與 AI 浪潮的增長,是值得考慮的投資策略。當然,投資大盤指數可能更加穩健也更分散風險,也能尋找看看科技巨頭以外的投資機會,但需謹慎評估資金分配,關注投資標的長期發展和個人資金風險,以實現長期穩健的投資收益。