
如果把過去兩年 AI 基礎設施的主旋律濃縮成一句話,很多人第一時間想到的會是「誰拿得到更多 GPU,誰就能吃到更多成長」。這個說法不算錯,但到了 2026 年,市場開始慢慢發現,真正值得注意的問題已經不是只有誰買到最多晶片,而是誰能把 AI 從訓練階段推進到大規模、可重複、可商業化的推理階段。這也是我今天想聊 Amazon 的原因。
最近在 nash-ai 的選題裡,我注意到一個很有意思的方向:有報告把重點放在「雲計算進入 AI 推理時代,AWS 有望後發先至」,也有報告從「AI 推理推動雲端資源供需趨緊、雲服務價格結構改變」切入。這兩個角度合在一起,其實指向的是同一件事:AI 正在改寫雲端產業的獲利邏輯,而 AWS 不只是想當一個出租算力的房東,它更想當那個同時握有土地、建材、電網、管理系統,甚至連租客施工圖都能提供的人。
簡單來說,市場如果還只把 AWS 當成「雲端老大」來看,可能已經有點低估它在 AI 時代的位置了。真正值得注意的,是 AWS 正在把自己的角色從通用雲平台,往「AI 全棧基礎設施提供者」推進。這個變化,會影響 Amazon 未來幾年的資本支出、AWS 的毛利結構、客戶黏著度,甚至連整個雲端產業的定價權分配都會被重新洗牌。
為什麼現在討論 AWS,時間點很重要
Amazon 在 2026 年 2 月公布的 2025 年第四季與全年財報裡,給了一個非常醒目的訊號。第四季 AWS 營收年增 24% 至 356 億美元,這是過去 13 個季度裡最快的成長速度;AWS 第四季營業利益達 125 億美元,全年 AWS 營收 1,287 億美元,營業利益 456 億美元。這些數字單看已經很強,但真正讓市場抬頭看的,其實是 Andy Jassy 直接講出的另一件事:Amazon 預期 2026 年整體資本支出大約會到 2,000 億美元,而且他明講,背後的重要驅動之一就是 AI。
這個數字的分量不只是「很大」而已,而是它等於告訴市場,Amazon 現在的判斷是:AI 基礎設施還在非常早期,現在不是收割期,而是卡位期。若公司願意在一年內投入這麼高的資本支出,代表管理層看到的不是短期題材,而是未來數年等級的需求曲線。
更值得注意的是,Amazon 的財報還揭露,過去十二個月自由現金流下降,主要就是因為購置不動產與設備的支出年增 507 億美元,而公司把原因直接指向 AI 投資。這個訊號很關鍵,因為它說明了兩件事。第一,Amazon 願意先承受自由現金流被壓縮,也要把 AI 基建先鋪出來。第二,管理層認為這筆錢花下去,未來能換回夠高的長期回報率。
這種表態方式很 Amazon。它不是先把故事講得很夢幻,再等市場買單;它比較像是先把錢砸下去,把路蓋好,再用財務結果證明自己不是在亂燒。對投資人來說,這種公司通常不會太輕鬆,因為短期報表看起來未必漂亮,但長期如果方向對,後勁往往比市場想像得更大。
AI 推理時代,跟過去的訓練敘事到底差在哪裡
很多人談 AI 基建,第一反應還是訓練大型模型。原因很簡單,訓練很燒錢、很燒 GPU,也最容易製造資本市場喜歡的大敘事。但如果把 AI 真正落地到企業應用、客服、程式開發、搜尋、推薦、企業知識庫、流程自動化這些場景,你會發現最後真正反覆發生、每天都在跑、會變成穩定支出的,其實是推理。
訓練比較像是蓋總部大樓,一次要花很多錢;推理比較像是大樓蓋好後,裡面每天開燈、開空調、跑電梯、處理人流。從商業角度看,推理決定的是模型能不能真的被廣泛使用,成本能不能壓到企業願意大量部署,延遲能不能低到使用者覺得「這東西真的能用」。
也因為如此,推理時代的競爭,不再只是比誰有最頂級的訓練晶片,而是比誰能提供更便宜、更穩定、更容易擴展、又能跟企業現有系統整合的整體方案。這裡的關鍵詞不只是 GPU,而是 token economics、模型切換成本、軟硬體協同、資料中心供電效率、網路互連、模型服務平台,以及企業 IT 團隊願不願意把核心工作流放進來。
換句話說,AI 推理時代比的不是單點性能,而是整套系統工程能力。這反而是 AWS 最有機會把優勢放大的地方。因為 AWS 從來就不是靠某一顆單品晶片吃飯,它擅長的是把底層算力、資料、平台工具、安全、部署和帳單模型整合成一個企業能用的方案。AI 一旦走到推理擴散階段,這種能力的價值會比單純「有沒有最強訓練卡」更重要。
AWS 的打法,不是硬碰硬複製 NVIDIA,而是自己重寫遊戲規則
現在談 AI 基建,所有人都會先看 NVIDIA,這很正常。但 AWS 真正有意思的地方,在於它沒有選擇照抄 NVIDIA 的玩法,而是試著建立自己的生態與成本曲線。
Amazon 近年一直在強推自研 AI 晶片,包括 Trainium 和 Inferentia。從 AWS 官網公開資料來看,Inferentia 主打推理場景,第一代 Inf1 強調相較可比 EC2 執行個體可帶來更高吞吐與更低單次推理成本;第二代 Inferentia2 進一步強調支援更大模型、更低延遲、分散式推理能力,以及更高的記憶體容量與頻寬。Trainium 則主打訓練與大型生成式 AI 工作負載,Trainium2 強調比前一代更高性能,且在價格效能上對部分 GPU 型方案具競爭力;Trainium3 則把重點放在下一代 agentic AI、reasoning 與多模態/影片生成工作負載。
如果只看規格,很多人可能會說,這不就是雲巨頭都在做的自研加速器嗎?但 AWS 跟其他人的不同,在於它不只是做一顆晶片,而是把晶片、EC2 instance、UltraServer、互連、Neuron SDK、Bedrock、SageMaker、EKS/ECS 等服務打包成一整條路徑。這代表 AWS 想爭奪的不是某個晶片季度銷量,而是客戶未來幾年的工作負載會不會長在 AWS 的工具鏈裡。
這裡有個常被忽略的重點:在 AI 時代,真正的 lock-in 不一定是來自資料格式,越來越可能來自「效能最佳化路徑」。如果一家公司已經把模型微調、部署、監控、成本優化、權限治理、Agent 工作流都搭在 AWS 的工具堆疊上,那它未來要整包搬家,其實沒有想像中容易。這種黏著度,往往比單純的雲主機搬遷還更高。
為什麼 Amazon 會特別強調推理,而不是只講訓練
從 Amazon 最新財報揭露的內容來看,管理層刻意提到幾個訊號:Trainium 與 Graviton 合計年化營收跑速已超過 100 億美元,且年增是三位數;Trainium2 已經 fully subscribed;超過 10 萬家公司使用 Bedrock;Trainium2 承載 Bedrock 多數推理工作;Anthropic 的 Project Rainier 由超過 50 萬顆 Trainium2 晶片支撐;Trainium3 供給到 2026 年中前幾乎都將被承諾完畢。
這些話如果拆開看,幾乎每一句都在傳遞同一個訊息:AWS 並不是只想在模型訓練市場插旗,它更想把推理成本做下來,讓更多企業願意把 AI 從 PoC 推到 production。因為對雲平台來說,真正最有價值的不是客戶偶爾來租一批非常貴的訓練資源,而是客戶把長期、反覆、持續產生流量的推理服務放在你這裡。
推理一旦成熟,雲平台的收入品質往往會更好理解。原因在於它更接近日常營運支出,而不是一次性專案支出。今天一家企業要做客服 agent、內部知識搜尋、AI coding assistant、文件摘要、風險偵測、推薦引擎,它用得不是一次,而是每天、每小時、每分鐘都在跑。這種需求如果長出規模,雲平台就不只是吃到一波 AI 熱潮,而是把 AI 變成長期的公用事業型收入。
也因此,推理成本結構比訓練更重要。企業不是不知道 AI 很酷,而是常常算完帳之後發現太貴、太慢、太難管。誰能把這三件事往下壓,誰就更有機會把試用客戶變成真正的大客戶。AWS 自研晶片的戰略意義,就在這裡。
Bedrock 的角色,比很多人想得還大
如果說 Trainium 和 Inferentia 是底層硬體,那 Bedrock 就是 AWS 在 AI 時代的中層作業系統。它的意義不只是提供模型 API,而是讓企業可以在同一個平台上接入多家模型、管理權限、安全、成本、評估、agent 開發與部署。
Amazon 在財報裡提到,Bedrock 已被超過 10 萬家公司使用,且持續加入來自 Amazon Nova、Anthropic、Google、OpenAI、NVIDIA、Mistral、Cohere 等不同供應商的模型。這個策略非常務實。因為企業真正在意的不是「我一輩子只用某一家模型」,而是「我能不能依照成本、延遲、能力與法規需求,隨時切換最適合的模型」。
這種多模型平台思維,會讓 AWS 在企業客戶面前更像基礎設施中立平台,而不是某一個模型陣營的業務代理。對企業來說,這很重要。因為模型市場變化太快,今天最強的不一定明天還最強;今天最划算的,也不一定半年後還划算。AWS 如果能在這個過程裡扮演「幫你降低切換摩擦、幫你管理風險與成本」的角色,它就不需要在每一個模型評比裡都拿第一,也能持續把流量留在自己平台上。
更進一步看,Bedrock 還在往 agent infrastructure 延伸。像是 AgentCore Policy、Evaluations、Memory 等能力,本質上都是在替企業解決一個越來越實際的問題:模型不只是回答問題,它要開始執行任務、碰流程、調系統、留下審計軌跡。當 AI 從 chatbot 升級成 agent,企業最怕的從來不是模型不夠聰明,而是它做錯事、越權、難追蹤、出了事不知道怎麼回溯。這種時候,比起模型參數多幾十億,企業更在意基礎設施有沒有治理能力。
這也是為什麼我會說,AWS 真正想搶的不是一輪模型流量,而是 AI 應用層背後的基礎設施定價權。只要企業級 agent 大規模落地,能提供安全、評估、記憶、部署、觀測、權限控管的平台,理論上就更有機會拿到更長的收入壽命。
這件事對 AWS 獲利能力是利多,還是風險
答案是兩者都有,而且先看短期與長期會得出不同結論。
短期來看,AWS 要拚 AI,資本支出一定重,折舊與基礎設施建設成本也會持續往上走。Amazon 2025 年自由現金流下降,就是一個很直接的證據。對只看短期現金流的人來說,這不會是太舒服的數字。再加上 AI 基建競爭激烈,Microsoft、Google、Oracle,甚至不少新型雲服務商都在搶,市場不可能沒有價格壓力。
但長期來看,如果 AWS 能把更多企業 AI 工作負載導向自己自研晶片與工具鏈,它的單位經濟模型有機會變得更漂亮。原因有三個。第一,自研晶片有助於降低對外部供應商的依賴,也讓成本控制空間變大。第二,推理工作負載若規模起來,收入可預測性通常比一次性訓練專案更好。第三,當平台從算力延伸到模型管理、agent orchestration 與安全治理,AWS 不再只是賣最底層硬體時間,而是可以吃到更多軟體與平台層價值。
這裡最值得注意的一點是,AWS 的營業利益率本來就明顯高於 Amazon 其他業務。2025 年 AWS 1,287 億美元營收對應 456 億美元營業利益,代表它仍然是整個 Amazon 利潤結構裡最重要的引擎。如果 AI 能讓 AWS 維持較高成長,又不至於嚴重侵蝕中長期利潤率,那對 Amazon 的整體估值支撐會很強。
問題在於,這條路不是沒有代價。你可以把它想像成一間原本已經很會賺錢的收費高速公路公司,現在決定再蓋一套 AI 專用高架系統。短期會看到工程款暴增、現金流壓力變大;但如果未來車流確實大增,且這條新高架還收得起費,公司的護城河反而可能變更深。
市場可能低估的一個點:AI 雲戰爭不只是模型戰,也是供應鏈戰
財報裡有一句話我覺得很值得注意。Amazon 在前瞻指引與風險因素裡提到,資源與供應波動,包括 memory chips,都是需要留意的變數。這句話看似普通,其實透露出 AI 雲戰爭早就不是單點產品競爭,而是整條供應鏈與資料中心建設能力的比拚。
AI 基建不是只要有晶片就好,還要有 HBM、伺服器、機櫃、交換器、光模組、供電、冷卻、土地、施工、維運與軟體堆疊。這也是為什麼近來市場對 AI 基礎設施的關注,從 GPU 一路擴散到記憶體、網通、電力與設備。AWS 若能靠自研晶片把部分關鍵環節掌握在自己手上,除了降低成本之外,還有一層更重要的戰略價值:提升供應可控性。
這一點,在推理時代尤其重要。因為推理需求一旦從少數模型公司擴展到成千上萬家企業,瓶頸不一定是最尖端訓練資源,而是「夠不夠便宜、夠不夠穩定、能不能快速擴到很多區域」。AWS 在全球資料中心、雲服務營運與企業交付上本來就有底子,現在再疊上自研晶片,實際上是在把供應鏈掌控力轉化成產品競爭力。
AWS 真正的後發優勢,可能不是技術,而是商業化能力
很多人會用「後發先至」這個詞來形容 AWS 在 AI 的機會,但如果要更精準,我會說 AWS 的優勢未必是它在所有 AI 技術指標上領先,而是它有機會在商業化與企業落地效率上後發追上。
原因很簡單。企業客戶在 AI 採購時,並不是只看 benchmark。它們還會看幾件事:既有資料是不是在這朵雲上、法遵跟權限能不能一起管、是否能跟現有資料庫和應用程式整合、帳單是否可控、全球部署是否成熟、技術團隊是不是找得到人維運。這些問題的答案,AWS 通常不差。
也就是說,AI 從研發熱潮走向企業擴散之後,決勝點可能從「誰最會做模型」逐漸轉向「誰最會讓企業把模型真正用起來」。如果這個判斷成立,那 AWS 的價值就不只是 AI 概念股,而是 AI 工業化過程中的基礎平台。
這點跟 Amazon 整體企業文化其實很一致。它很少只賣一個夢,而是習慣把流程、工具、供應鏈與規模一起做出來。從電商物流到雲端服務,Amazon 強的常常不是某個最耀眼的瞬間,而是把一個原本昂貴、複雜、門檻高的東西,變成可以大規模、標準化、反覆售賣的服務。AI 如果進入這個階段,AWS 就會是非常值得追蹤的角色。
但風險也不能假裝看不見
我不會把 AWS 這條線講得太完美,因為它明顯仍有幾個風險點。
第一,AI 需求很強,不代表每一筆支出都能有效轉成高回報。Amazon 願意投 2,000 億美元資本支出是一種雄心,但也是巨大的執行壓力。如果供給鋪太快、需求落地慢於預期,折舊與資本效率壓力就會浮上來。
第二,自研晶片雖然有戰略價值,但企業採用習慣不是一天能改變。CUDA 生態、開發者熟悉度、既有最佳化經驗,仍然是 NVIDIA 很難被快速撼動的原因。AWS 要讓更多工作負載遷移到 Trainium / Inferentia,不只要證明便宜,還要證明好用、穩定、工具成熟。
第三,AI 平台層競爭會越來越擁擠。Microsoft 有 Azure 與 OpenAI 生態協同,Google 有 TPU 與模型能力,Oracle 在特定高效能與 AI 租賃市場也積極卡位。AWS 不會處在沒有競爭者的舒服環境。
第四,市場現在對 AI 的容忍度很高,但一旦總體環境變化、企業 IT 預算收緊,資本市場會開始更嚴格檢查「高資本支出到底換到了什麼」。到時候 AWS 必須用更具體的工作負載成長、客戶留存與利潤率表現來回答問題。
我的看法:AWS 值得看的,不只是成長率,而是它正在重塑自己的身分
如果要用一句話總結今天這篇,我會說:AWS 的重點,已經不是「它能不能參與 AI」,而是「它能不能把 AI 變成下一個屬於自己的平台週期」。
市場過去很習慣把 AWS 看成成熟雲業務,成長穩、獲利強,但想像空間比最熱門 AI 公司小。可現在情況有點不一樣了。當 Amazon 一邊用 AWS 吃企業 AI 基建,一邊用 Bedrock、AgentCore、Nova 等服務往上打平台層,再加上自研 Trainium / Inferentia 往下接住成本與供應鏈,AWS 的位置其實越來越像一個 AI 時代的「基礎設施作業系統」。
這個位置有個很大的好處:它未必需要在每個單點都當第一名,卻可能在整個產業價值鏈裡拿到最穩定、最長尾、最難搬走的一塊收入。
從這個角度來看,AWS 進入 AI 推理時代,真正值得注意的,不只是第四季 24% 的營收成長,也不只是自研晶片成長三位數,而是 Amazon 正試著把雲端競爭從「賣算力」升級成「賣整套 AI 生產系統」。如果它做成了,未來幾年市場重新評價的,可能不是 AWS 短期多賺幾個百分點,而是整個 Amazon 在 AI 基建時代的角色層級被拉高了。
對一般投資讀者來說,這件事最值得追蹤的幾個觀察點,不是今天要不要下結論,而是後續幾季可以持續看:AWS 營收增速能否維持高檔、Bedrock 與 agent 相關服務的採用是否擴散、自研晶片是否持續提升滲透率、AI 資本支出是否真的轉成更高的企業工作負載,以及自由現金流壓力在未來幾季會不會逐步被更高獲利吸收。
簡單來說,AWS 這條線現在最有意思的地方,不是它看起來多熱,而是它越來越像下一輪 AI 基礎設施秩序裡,不能被忽略的那個定價者。
參考資料
Amazon 2025 Q4 / FY2025 Earnings Release(SEC Exhibit 99.1)
Amazon 2025 Form 10-K(SEC)
AWS Inferentia 官方頁面
AWS Trainium 官方頁面
nash-ai.cn 站內選題檢索:亞馬遜 / 雲計算 / AI 推理相關報告























