隨著台積電(2330)今日(4/27)攻上 2,330元,加權指數也成功突破四萬點後,AI市場卻處於一場極其矛盾的十字路口:科技巨頭們一邊深陷如火如荼的算力軍備競賽,一邊卻面臨難以轉嫁的 Token 成本危機。隨著 AI Agent(代理)時代全面開啟,模型廠商紛紛被迫調整收費模式;而在大眾對 AI 依賴度日益攀升的現狀下,種種跡象正無情地「實錘」了《大賣空》傳奇人物 Michael Burry 所指控的:「AI的獲利是建立在虛假年限上的折舊騙局」。
什麼是 Token?它背後燒的是什麼錢?
在 AI 的世界裡,Token 是語言模型處理資訊的最小單位。你問 AI 一個問題、AI 給你一段回答,整個過程消耗的 Token 數量,就是這次對話的「計費單位」。背後的成本意義:每個 Token 產出的瞬間,消耗的是「昂貴的 GPU 折舊」、「驚人的資料中心電力負荷」、「龐大的水冷散熱費」以及「頂尖研發人力」。Token 並非虛擬的數字,它是精密硬體與能源高度消耗下的產物,這也是為什麼 AI 模型必須精確計算每一組對話的費用。
簡單說,Token 就是把一座超級電腦的使用時間,切割成最小粒度來計費的概念。越複雜的問題,消耗的 Token 越多;越高階的模型,每個 Token 的運算成本越高。
OpenAI 燒了多少錢?數字震驚市場
2025 年 7 月,OpenAI 執行長 Sam Altman 在社群媒體上自豪地宣布:OpenAI 年底前將上線超過 100 萬張 GPU,並開玩笑說接下來要想辦法再擴大 100 倍。這句話的背後是什麼規模的燒錢?根據 Epoch AI 的估算,OpenAI 在 2024 年的雲端算力支出約達 70 億美元,其中訓練與研究算力約 50 億,推論算力約 20 億。而到了 2025~2030 年,OpenAI 預計在算力運營上的累計支出將高達 6,000 億美元。
就在 2026 年初,OpenAI 剛完成一輪融資,取得 1,220 億美元的新資金,估值達 8,520 億美元。其官方公告中明確揭露:OpenAI 的 API 現在每分鐘處理超過 150 億個 Token。
使用 AI的80/20法則,人機協作成為市場主流,
儘管 AI 效能突飛猛進,但市場在 2026 年赫然發現一個「成本悖論」:AI 在完整度 80% 到 90% 以上的最後衝刺,成本竟然遠高於人力。
目前的 AI 模型能輕鬆地將任務完成度推向 80%,但在後續的精密修正、事實查核與邏輯串聯上,AI 的邊際成本會因為需要進行多次的「反思(Reflection)」與「驗證(Verification)」而飆升。對於企業而言,讓 AI 做到 90% 以上的準確度,其燃燒的 Token 費用,可能遠超聘請專業的人士來做最後的點睛之筆,反而更便宜。因此「AI 負責前 80%,人類負責後 20%」的人機協作,已成為目前市場規避昂貴算力陷阱的主流策略。
算力供不應求:平價訂閱計畫的靜默崩潰
AI 代理(AI Agentic)的普及徹底撕裂了訂閱制的商業邏輯。過去平台靠「多數人輕度使用」來補貼重度用戶,但一支自動化代理程式在用戶睡覺時持續運行,單日消耗的 Token 量可能超過普通用戶一個月的總量。針對高消耗的 AI 代理(Agent)需求,Claude 已率先採取行動,要求第三方代理工具必須改用 API Key 接入,藉此將原本模糊的訂閱成本直接轉化為「按量計費」模式,讓高頻運算的負擔回歸使用者付費。
而 輝達(NVIDIA)執行長黃仁勳在 GTC 2026 承諾,下一代 Vera Rubin NVL72 每百萬 Token 成本將降至現行 Blackwell 的十分之一。然而,這道技術紅利仍面臨時間與資本的雙重考驗:受限於 2026 年第三季才出貨的排期,加上缺貨潮導致組裝成本攀升,整機報價已飆升至 650 萬至 800 萬美元。這意味著在享受廉價 Token 之前,必須先跨越這道極其沈重的硬體資本門檻。
Token 成本下跌與定價調整:實錘「折舊騙局」的終局
全文請至:玩股網-玩股華安閱讀





















