HBM4量產推動Nvidia GPU成本與效能新平衡

2025/09/23 更新2025/09/22 發佈閱讀 3 分鐘

大家早安，今天我們來談記憶體的最新變化。SK Hynix 在 9 月宣布完成 HBM4 的開發，並準備量產，同時將樣本提供給 Nvidia 測試。這不只是一次產品迭代，而是直接改寫 AI GPU 的成本結構，呼應我們在記憶體世代演進：DRAM、Flash 與 HBM 和記憶體的金字塔分工：Cache、DRAM 與 SSD 中的討論。

HBM3 的極限與 HBM4 的突破

HBM3E 與 HBM4 的樣本對比，HBM3E 每堆疊頻寬已達上限，而 HBM4 將介面位寬擴大、速率提升，單顆效能大幅超越 HBM3。這代表 GPU 與 CPU 在相同封裝空間內能獲得更高的記憶體頻寬與能效。

HBM3 與 HBM3E 已經支撐起生成式 AI 的第一波浪潮，但也暴露出兩大問題。第一是單顆 GPU 的記憶體頻寬仍不足，模型越大就越容易受限；第二是成本快速墊高，記憶體已經成為一張 AI 加速卡中最貴的元件之一。

HBM4 帶來的關鍵轉變在於，它將頻寬再推高一個檔次，讓記憶體而非算力的瓶頸被部分舒緩。這意味著未來的 GPU 訓練速度不只靠堆更多 GPU，而是單卡本身的效能會更接近線性擴張。同時，雖然單位價格比 HBM3E 更高，但因為頻寬密度的提升，單次運算的成本效率反而可能下降，這是雲端服務商最關心的數字。

成本結構與供應鏈的再分配

Nvidia Rubin GPU 搭載 SK Hynix HBM4，並透過台積電先進封裝與 CPU 協同運算。

與 HBM3 相比，HBM4 在價格上的溢價高達 60–70%。這將使 GPU 廠商在成本表中的記憶體比重進一步拉高，甚至可能超過矽晶片本身。這也解釋了為什麼 Nvidia 會率先與 SK Hynix合作，因為能掌握最新世代 HBM 的產能，就等於確保自家 Rubin GPU 在市場上的領先。

對供應鏈來說，這是一次重新洗牌的機會。HBM3 時代 SK Hynix 就占據超過一半市場，HBM4 若能穩定量產，優勢將被進一步鞏固。反觀 Samsung 與 Micron，若在良率或交期上落後，將可能被排除在第一波 AI GPU 訂單之外。

當我們討論AI 模型成本為什麼這麼高時，常想到 GPU 算力價格。但從 HBM3 過渡到 HBM4 的過程顯示，真正的成本重心正在轉向記憶體。HBM4 把效能推向新高，但同時提醒我們：AI 的經濟學不是只有算力曲線，還包含記憶體的帶寬曲線與價格曲線。

對雲端業者來說，HBM4 是一把雙刃劍。它能讓單位 GPU 的算力更好發揮，降低能耗與延遲，但也讓每張加速卡的單價更高。未來如何在模型訓練與推理的定價中轉嫁這筆成本，將是下一階段 AI 商業模式的焦點。

（延伸閱讀：記憶體世代演進：DRAM、Flash 與 HBM、記憶體的金字塔分工：Cache、DRAM 與 SSD）

#記憶體

#成本

#NVIDIA

想想 | Thoughtstream 想想科技

留言

留言分享你的想法！

想想 | Thoughtstream

4會員

131內容數

想想，陪你一起理解世界的節奏。聚焦於半導體、人工智慧、能源、量子科技與虛擬貨幣，結合最前沿的學術研究與全球產業觀察，幫助你在資訊爆炸的時代，快速看清知識的脈絡，理解科技如何影響商業與生活。

想想 | Thoughtstream 的其他內容

2025/09/19

Meta 發表 Ray-Ban Display 神經手環智慧眼鏡搶攻市場

Meta 推出 Ray-Ban Display 與神經手環，以低價切入智慧眼鏡市場，探索日常可戴的 AI 入口。

2025/09/19

Meta 發表 Ray-Ban Display 神經手環智慧眼鏡搶攻市場

Meta 推出 Ray-Ban Display 與神經手環，以低價切入智慧眼鏡市場，探索日常可戴的 AI 入口。

2025/09/18

SpaceX 170 億美元收購 EchoStar 頻譜，加速衛星直連手機服務

SpaceX 170 億美元收購 EchoStar 頻譜，補齊直連手機拼圖，挑戰蘋果與電信商，奪取全球行動網路話語權。

2025/09/18

SpaceX 170 億美元收購 EchoStar 頻譜，加速衛星直連手機服務

SpaceX 170 億美元收購 EchoStar 頻譜，補齊直連手機拼圖，挑戰蘋果與電信商，奪取全球行動網路話語權。

2025/09/17

XPU 正在從概念成為半導體市場的訂單現實

XPU 正從概念走向落地，結合異質運算、3.5D 封裝與 SNIA 標準，Broadcom、Intel、Nvidia 各自推進新世代算力。

2025/09/17

XPU 正在從概念成為半導體市場的訂單現實

XPU 正從概念走向落地，結合異質運算、3.5D 封裝與 SNIA 標準，Broadcom、Intel、Nvidia 各自推進新世代算力。

看更多

你可能也想看

方格子 vocus 官方沙龍

線上街訪直擊！雙 11 購物車大公開！

雙11於許多人而言，不只是單純的折扣狂歡，更是行事曆裡預定的，對美好生活的憧憬。錢錢沒有不見，它變成了快樂，跟讓臥房、辦公桌、每天早晨的咖啡香升級的樣子！這次格編突擊辦公室，也邀請 vocus「野格團」創作者分享掀開蝦皮購物車的簾幕，「加入購物車」的瞬間，藏著哪些靈感，或是對美好生活的想像？

#vocusforBusiness#雙11#蝦皮分潤計畫

2025/10/28

方格子 vocus 官方沙龍

線上街訪直擊！雙 11 購物車大公開！

#vocusforBusiness#雙11#蝦皮分潤計畫

2025/10/28

黑麥的沙龍

記憶體回暖了？？

最近，隨著HBM的戰爭日益激烈，記憶體大廠不論韓國三星，海力士，還是美國的美光，紛紛擴廠迎接未來的需求。但是，即便擴產，對於整體的需求來說，仍然有一段空窗期，更重要的是，如果三大廠都投入HBM的應用，對於傳統的DRAM帶來產能上的缺乏，有機會讓未來的DDR5以上，甚至是DDR3/4都進入供不應求！

2024/08/04

黑麥的沙龍

記憶體回暖了？？

2024/08/04

M大_峰谷之間

美光 (MU) 財報解讀 - Q3 FY24

未來將新增 AI & 半導體巨頭財報之個人解讀。

#美光#MU#HBM

2024/06/27

M大_峰谷之間

美光 (MU) 財報解讀 - Q3 FY24

未來將新增 AI & 半導體巨頭財報之個人解讀。

#美光#MU#HBM

2024/06/27

廣告雜誌

黃仁勳風暴(三)：NVIDIA與AWS正合作推動設計全球最快的GPU驅動AI超級電腦

科技巨擘聯手推進生成式AI發展開創人工智慧新時代在生成式人工智慧(Generative AI)的浪潮中，雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作，推出一系列革命性的基礎設施、軟體和服務。

#黃仁勳#NVIDIA#AWS

2024/06/06

廣告雜誌

黃仁勳風暴(三)：NVIDIA與AWS正合作推動設計全球最快的GPU驅動AI超級電腦

#黃仁勳#NVIDIA#AWS

2024/06/06

期貨選擇權交易紀錄心得交流

NVIDIA 黃仁勳 - AI演講即時摘要_元大證券

NVIDIA 黃仁勳 - AI人工智慧時代如何帶動全球新產業革命（個人紀錄用） 🇺🇸Omniverse 就是未來集大成，而加速運算、人工智慧就是兩個最重要的技術核心 🇺🇸CPU效能的擴充速度正在大幅降低，提出「運算通膨」概念

#NVIDIA#AI人工智慧#革命

2024/06/03

期貨選擇權交易紀錄心得交流

NVIDIA 黃仁勳 - AI演講即時摘要_元大證券

#NVIDIA#AI人工智慧#革命

2024/06/03

subzero

AI PC + AI OS

AI PC 硬體 + AI OS + AI PC 摘要

#AIPC#AIOS

2024/05/30

subzero

AI PC + AI OS

AI PC 硬體 + AI OS + AI PC 摘要

#AIPC#AIOS

2024/05/30

每日發車

筆記-阿文師(連乾文)-財經一路發-24.05.17

筆記-阿文師(連乾文)-財經一路發-24.05.17 *目前的數據: A100、H100，用主機板、GPU模組出貨，占比95%。 GH200，整機櫃出貨，占比5%。 *今年3月輝達發表GB200，以整機櫃出貨，有利鴻海、廣達，以模組出貨、3-4萬美金，現在改用整機櫃、出貨金額提高。

2024/05/20

每日發車

筆記-阿文師(連乾文)-財經一路發-24.05.17

2024/05/20

每日發車

筆記-24.03.25-科技財知道

筆記-24.03.25-科技財知道 *輝達想做的事情非常多，包括AI GPU的算力提供(GB200)、協助半導體製造(cuLitho)、車用晶片(Drive Thor)、機器人開發平台(GR00T)、元宇宙等物理模擬(Omniverse)。 *GB200 = 2個B100+1個Grace CPU

2024/03/31

每日發車

筆記-24.03.25-科技財知道

2024/03/31

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News