HBM4量產推動Nvidia GPU成本與效能新平衡

更新 發佈閱讀 3 分鐘
raw-image

大家早安,今天我們來談記憶體的最新變化。SK Hynix 在 9 月宣布完成 HBM4 的開發,並準備量產,同時將樣本提供給 Nvidia 測試。這不只是一次產品迭代,而是直接改寫 AI GPU 的成本結構,呼應我們在 記憶體世代演進:DRAM、Flash 與 HBM記憶體的金字塔分工:Cache、DRAM 與 SSD 中的討論。


HBM3 的極限與 HBM4 的突破

HBM3E 與 HBM4 的樣本對比,HBM3E 每堆疊頻寬已達上限,而 HBM4 將介面位寬擴大、速率提升,單顆效能大幅超越 HBM3。這代表 GPU 與 CPU 在相同封裝空間內能獲得更高的記憶體頻寬與能效。

HBM3E 與 HBM4 的樣本對比,HBM3E 每堆疊頻寬已達上限,而 HBM4 將介面位寬擴大、速率提升,單顆效能大幅超越 HBM3。這代表 GPU 與 CPU 在相同封裝空間內能獲得更高的記憶體頻寬與能效。

HBM3 與 HBM3E 已經支撐起生成式 AI 的第一波浪潮,但也暴露出兩大問題。第一是單顆 GPU 的記憶體頻寬仍不足,模型越大就越容易受限;第二是成本快速墊高,記憶體已經成為一張 AI 加速卡中最貴的元件之一。

HBM4 帶來的關鍵轉變在於,它將頻寬再推高一個檔次,讓記憶體而非算力的瓶頸被部分舒緩。這意味著未來的 GPU 訓練速度不只靠堆更多 GPU,而是單卡本身的效能會更接近線性擴張。同時,雖然單位價格比 HBM3E 更高,但因為頻寬密度的提升,單次運算的成本效率反而可能下降,這是雲端服務商最關心的數字。


成本結構與供應鏈的再分配

Nvidia Rubin GPU 搭載 SK Hynix HBM4,並透過台積電先進封裝與 CPU 協同運算。

Nvidia Rubin GPU 搭載 SK Hynix HBM4,並透過台積電先進封裝與 CPU 協同運算。

與 HBM3 相比,HBM4 在價格上的溢價高達 60–70%。這將使 GPU 廠商在成本表中的記憶體比重進一步拉高,甚至可能超過矽晶片本身。這也解釋了為什麼 Nvidia 會率先與 SK Hynix合作,因為能掌握最新世代 HBM 的產能,就等於確保自家 Rubin GPU 在市場上的領先。

對供應鏈來說,這是一次重新洗牌的機會。HBM3 時代 SK Hynix 就占據超過一半市場,HBM4 若能穩定量產,優勢將被進一步鞏固。反觀 Samsung 與 Micron,若在良率或交期上落後,將可能被排除在第一波 AI GPU 訂單之外。

當我們討論AI 模型成本為什麼這麼高時,常想到 GPU 算力價格。但從 HBM3 過渡到 HBM4 的過程顯示,真正的成本重心正在轉向記憶體。HBM4 把效能推向新高,但同時提醒我們:AI 的經濟學不是只有算力曲線,還包含記憶體的帶寬曲線與價格曲線。

對雲端業者來說,HBM4 是一把雙刃劍。它能讓單位 GPU 的算力更好發揮,降低能耗與延遲,但也讓每張加速卡的單價更高。未來如何在模型訓練與推理的定價中轉嫁這筆成本,將是下一階段 AI 商業模式的焦點。

(延伸閱讀:記憶體世代演進:DRAM、Flash 與 HBM記憶體的金字塔分工:Cache、DRAM 與 SSD




留言
avatar-img
留言分享你的想法!
avatar-img
邊喝邊想
3會員
103內容數
有些問題,邊喝點東西,邊想,會比較有答案。這裡是我閱讀、觀察、懷疑,然後慢慢轉化的地方。寫的東西有科技、咖啡、酒,偶爾是神話。如果你也喜歡慢慢想事情,跟著我的節奏,這裡或許適合你。
邊喝邊想的其他內容
2025/09/19
Meta 推出 Ray-Ban Display 與神經手環,以低價切入智慧眼鏡市場,探索日常可戴的 AI 入口。
Thumbnail
2025/09/19
Meta 推出 Ray-Ban Display 與神經手環,以低價切入智慧眼鏡市場,探索日常可戴的 AI 入口。
Thumbnail
2025/09/18
SpaceX 170 億美元收購 EchoStar 頻譜,補齊直連手機拼圖,挑戰蘋果與電信商,奪取全球行動網路話語權。
Thumbnail
2025/09/18
SpaceX 170 億美元收購 EchoStar 頻譜,補齊直連手機拼圖,挑戰蘋果與電信商,奪取全球行動網路話語權。
Thumbnail
2025/09/17
XPU 正從概念走向落地,結合異質運算、3.5D 封裝與 SNIA 標準,Broadcom、Intel、Nvidia 各自推進新世代算力。
Thumbnail
2025/09/17
XPU 正從概念走向落地,結合異質運算、3.5D 封裝與 SNIA 標準,Broadcom、Intel、Nvidia 各自推進新世代算力。
Thumbnail
看更多
你可能也想看
Thumbnail
最近,隨著HBM的戰爭日益激烈,記憶體大廠不論韓國三星,海力士,還是美國的美光,紛紛擴廠迎接未來的需求。但是,即便擴產,對於整體的需求來說,仍然有一段空窗期,更重要的是,如果三大廠都投入HBM的應用,對於傳統的DRAM帶來產能上的缺乏,有機會讓未來的DDR5以上,甚至是DDR3/4都進入供不應求!
Thumbnail
最近,隨著HBM的戰爭日益激烈,記憶體大廠不論韓國三星,海力士,還是美國的美光,紛紛擴廠迎接未來的需求。但是,即便擴產,對於整體的需求來說,仍然有一段空窗期,更重要的是,如果三大廠都投入HBM的應用,對於傳統的DRAM帶來產能上的缺乏,有機會讓未來的DDR5以上,甚至是DDR3/4都進入供不應求!
Thumbnail
未來將新增 AI & 半導體巨頭財報之個人解讀。
Thumbnail
未來將新增 AI & 半導體巨頭財報之個人解讀。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
NVIDIA 黃仁勳 - AI人工智慧時代如何帶動全球新產業革命(個人紀錄用) 🇺🇸Omniverse 就是未來集大成,而加速運算、人工智慧就是兩個最重要的技術核心 🇺🇸CPU效能的擴充速度正在大幅降低,提出「運算通膨」概念
Thumbnail
NVIDIA 黃仁勳 - AI人工智慧時代如何帶動全球新產業革命(個人紀錄用) 🇺🇸Omniverse 就是未來集大成,而加速運算、人工智慧就是兩個最重要的技術核心 🇺🇸CPU效能的擴充速度正在大幅降低,提出「運算通膨」概念
Thumbnail
AI PC 硬體 + AI OS + AI PC 摘要
Thumbnail
AI PC 硬體 + AI OS + AI PC 摘要
Thumbnail
筆記-阿文師(連乾文)-財經一路發-24.05.17 *目前的數據:  A100、H100,用主機板、GPU模組出貨,占比95%。  GH200,整機櫃出貨,占比5%。 *今年3月輝達發表GB200,以整機櫃出貨,有利鴻海、廣達, 以模組出貨、3-4萬美金, 現在改用整機櫃、出貨金額提高。
Thumbnail
筆記-阿文師(連乾文)-財經一路發-24.05.17 *目前的數據:  A100、H100,用主機板、GPU模組出貨,占比95%。  GH200,整機櫃出貨,占比5%。 *今年3月輝達發表GB200,以整機櫃出貨,有利鴻海、廣達, 以模組出貨、3-4萬美金, 現在改用整機櫃、出貨金額提高。
Thumbnail
筆記-24.03.25-科技財知道 *輝達想做的事情非常多,包括AI GPU的算力提供(GB200)、協助半導體製造(cuLitho)、車用晶片(Drive Thor)、機器人開發平台(GR00T)、元宇宙等物理模擬(Omniverse)。 *GB200 = 2個B100+1個Grace CPU
Thumbnail
筆記-24.03.25-科技財知道 *輝達想做的事情非常多,包括AI GPU的算力提供(GB200)、協助半導體製造(cuLitho)、車用晶片(Drive Thor)、機器人開發平台(GR00T)、元宇宙等物理模擬(Omniverse)。 *GB200 = 2個B100+1個Grace CPU
Thumbnail
在本波開始起漲前就提過主流會是 AI + IC 族群,而2023年至今也印證了 "錢永遠比人聰明" 、 "錢只會駐足在有意義與有前景的產業與族群上",事實也證明大盤由11月初15975.91起漲至今日最高點19300.49漲幅達3357點 (+21.02%)
Thumbnail
在本波開始起漲前就提過主流會是 AI + IC 族群,而2023年至今也印證了 "錢永遠比人聰明" 、 "錢只會駐足在有意義與有前景的產業與族群上",事實也證明大盤由11月初15975.91起漲至今日最高點19300.49漲幅達3357點 (+21.02%)
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News