為何 AI GPU 一定要使用 HBM

更新 發佈閱讀 6 分鐘

🟩 AI GPU「一定要」用HBM(物理原因)

這不是單純工程選擇,而是 AI 計算物理極限 的結果。

一句話:

AI ≠ compute problem,而是 memory movement problem

下面從物理層 → 架構層 → AI scaling 層,完整講清楚。


⭐ 一、AI 計算本質:資料搬移主導

在 LLM / Transformer 中:

Compute FLOPs  <<  Memory traffic

原因:

  • 權重矩陣巨大
  • activation 巨大
  • KV cache 巨大
  • attention streaming

👉 GPU 大部分時間在 等資料

這就是 memory wall


⭐ 二、Memory wall 的物理來源

🔷 1️⃣ 電子傳輸距離

功耗近似:

Energy ∝ capacitance × distance

👉 距離越遠 → 功耗越高

比較

raw-image

👉 HBM 最短


🔷 2️⃣ Pin density 限制

傳統 DRAM:

  • PCB trace
  • package edge pins

👉 IO pin 數量受封裝限制

結果

👉 bandwidth ceiling


🔷 3️⃣ Frequency scaling 不可行

GDDR 想提高 bandwidth:

bandwidth = pins × frequency

但:

  • 高頻 → signal integrity
  • jitter
  • power
  • EM loss

👉 GHz scaling 成本極高


⭐ 三、HBM 的物理解法

🔷 HBM = 3D + 2.5D integration

raw-image

HBM 使用:

  • TSV(Through Silicon Via)
  • silicon interposer
  • 3D stack

👉 本質 = memory proximity engineering


🔷 1️⃣ 超寬 IO(核心)

HBM:

  • 1024 bit / stack
  • 多 stack

👉 aggregate bus width = tens of thousands bit

GDDR:

  • 32 bit channel

👉 HBM 用寬度,不用頻率


🔷 2️⃣ mm 級距離

HBM:

  • GPU die 旁邊
  • interposer

👉 RC delay ↓

👉 energy ↓


🔷 3️⃣ 並行 memory banking

HBM stack:

  • 多 die
  • 多 bank

👉 massive parallel memory

適合:

  • matrix streaming
  • tensor access

⭐ 四、AI 為何比 graphics 更依賴 HBM

🔷 Graphics

  • cache reuse
  • locality
  • pipeline reuse

👉 bandwidth 壓力較低


🔷 AI

  • weight streaming
  • activation streaming
  • KV cache

👉 near worst-case memory pattern


⭐ 五、Scaling law 使 HBM 成為必然

AI scaling:

model size ↑
context ↑
batch ↑

👉 memory traffic ≈ O(N)

Compute scaling:

👉 O(N log N)

👉 memory 變 bottleneck


⭐ 六、Energy economics(最深原因)

移動 32bit:

raw-image

👉 memory access ≫ compute

HBM 目標:

👉 降低 memory energy


⭐ 七、為何 GDDR 不行

raw-image

👉 GDDR 是 PCB memory

👉 HBM 是 package memory


⭐ 八、最直觀理解

🔷 GDDR

👉 memory 在城市外

👉 要開高速公路


🔷 HBM

👉 memory 在 CPU 旁

👉 走小路

👉 latency ↓

👉 energy ↓

👉 bandwidth ↑


⭐ 九、一句話物理結論

AI GPU 必須 HBM,因為 memory movement energy dominates compute energy,而 HBM 是唯一能降低 movement energy 的封裝技術


⭐ 十、延伸前沿(非常重要)

HBM 之後:

  • HBM4
  • optical memory link
  • wafer-scale memory
  • memory fabric

👉 AI computing → memory-centric computing




留言
avatar-img
sirius數字沙龍
7會員
190內容數
吃自助火鍋啦!不要客氣,想吃啥,請自行取用!
sirius數字沙龍的其他內容
2026/02/23
🟩 NVIDIA AI Scale Roadmap (H100 → H200 → B200 → GB200 → Rubin) 這條 roadmap 是近年 AI 基礎設施最重要技術演進之一。 本質是一條: AI 模型 scaling 需求 → GPU 架構 → 系統級算力 演化鏈。
Thumbnail
2026/02/23
🟩 NVIDIA AI Scale Roadmap (H100 → H200 → B200 → GB200 → Rubin) 這條 roadmap 是近年 AI 基礎設施最重要技術演進之一。 本質是一條: AI 模型 scaling 需求 → GPU 架構 → 系統級算力 演化鏈。
Thumbnail
2026/02/23
🟩 NVIDIA 全 GPU Hierarchy (RTX 5090 → RTX Pro → H200 → B200 → GB200) NVIDIA GPU 並不是單一產品線,而是完整算力層級架構。 可理解為: PC → 工作站 → 單卡 AI → AI 基礎設施 → AI 超級系統
Thumbnail
2026/02/23
🟩 NVIDIA 全 GPU Hierarchy (RTX 5090 → RTX Pro → H200 → B200 → GB200) NVIDIA GPU 並不是單一產品線,而是完整算力層級架構。 可理解為: PC → 工作站 → 單卡 AI → AI 基礎設施 → AI 超級系統
Thumbnail
2026/02/23
🟩 NVIDIA RTX 5090 vs B200 完整比較 這兩張 GPU 雖然同屬 Blackwell 架構,但定位完全不同: RTX 5090 → 消費級 / 工作站 / 遊戲 / 本地 AI B200 → 資料中心 / AI 訓練 / 超級算力
Thumbnail
2026/02/23
🟩 NVIDIA RTX 5090 vs B200 完整比較 這兩張 GPU 雖然同屬 Blackwell 架構,但定位完全不同: RTX 5090 → 消費級 / 工作站 / 遊戲 / 本地 AI B200 → 資料中心 / AI 訓練 / 超級算力
Thumbnail
看更多
你可能也想看
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
愛與恨之間 便是戀人 極其感傷的距離
Thumbnail
愛與恨之間 便是戀人 極其感傷的距離
Thumbnail
你我之間的距離 無法用尺丈量 要用被思念懊悔 不斷折磨的失眠
Thumbnail
你我之間的距離 無法用尺丈量 要用被思念懊悔 不斷折磨的失眠
Thumbnail
怎樣的距離才是最佳的距離,有時加速有時滑行偶而煞車,不疾不徐隨著心的節奏前進,不斷變動也不斷調整,沒有固定答案變數太多,只能自己親身體會,慢慢摸索不用著急,記得保持彈性多點伸縮空間,會讓人生的旅途多份自在。
Thumbnail
怎樣的距離才是最佳的距離,有時加速有時滑行偶而煞車,不疾不徐隨著心的節奏前進,不斷變動也不斷調整,沒有固定答案變數太多,只能自己親身體會,慢慢摸索不用著急,記得保持彈性多點伸縮空間,會讓人生的旅途多份自在。
Thumbnail
你們痛的鋒利有一樣的質地 轉身的方式壞的同個樣子 然後你明白誰離開誰其實沒什麼分別 你們終究擁有同樣的距離
Thumbnail
你們痛的鋒利有一樣的質地 轉身的方式壞的同個樣子 然後你明白誰離開誰其實沒什麼分別 你們終究擁有同樣的距離
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News