vocus logo

方格子 vocus

為何 AI GPU 一定要使用 HBM

更新 發佈閱讀 6 分鐘

🟩 AI GPU「一定要」用HBM(物理原因)

這不是單純工程選擇,而是 AI 計算物理極限 的結果。

一句話:

AI ≠ compute problem,而是 memory movement problem

下面從物理層 → 架構層 → AI scaling 層,完整講清楚。


⭐ 一、AI 計算本質:資料搬移主導

在 LLM / Transformer 中:

Compute FLOPs  <<  Memory traffic

原因:

  • 權重矩陣巨大
  • activation 巨大
  • KV cache 巨大
  • attention streaming

👉 GPU 大部分時間在 等資料

這就是 memory wall


⭐ 二、Memory wall 的物理來源

🔷 1️⃣ 電子傳輸距離

功耗近似:

Energy ∝ capacitance × distance

👉 距離越遠 → 功耗越高

比較

raw-image

👉 HBM 最短


🔷 2️⃣ Pin density 限制

傳統 DRAM:

  • PCB trace
  • package edge pins

👉 IO pin 數量受封裝限制

結果

👉 bandwidth ceiling


🔷 3️⃣ Frequency scaling 不可行

GDDR 想提高 bandwidth:

bandwidth = pins × frequency

但:

  • 高頻 → signal integrity
  • jitter
  • power
  • EM loss

👉 GHz scaling 成本極高


⭐ 三、HBM 的物理解法

🔷 HBM = 3D + 2.5D integration

raw-image

HBM 使用:

  • TSV(Through Silicon Via)
  • silicon interposer
  • 3D stack

👉 本質 = memory proximity engineering


🔷 1️⃣ 超寬 IO(核心)

HBM:

  • 1024 bit / stack
  • 多 stack

👉 aggregate bus width = tens of thousands bit

GDDR:

  • 32 bit channel

👉 HBM 用寬度,不用頻率


🔷 2️⃣ mm 級距離

HBM:

  • GPU die 旁邊
  • interposer

👉 RC delay ↓

👉 energy ↓


🔷 3️⃣ 並行 memory banking

HBM stack:

  • 多 die
  • 多 bank

👉 massive parallel memory

適合:

  • matrix streaming
  • tensor access

⭐ 四、AI 為何比 graphics 更依賴 HBM

🔷 Graphics

  • cache reuse
  • locality
  • pipeline reuse

👉 bandwidth 壓力較低


🔷 AI

  • weight streaming
  • activation streaming
  • KV cache

👉 near worst-case memory pattern


⭐ 五、Scaling law 使 HBM 成為必然

AI scaling:

model size ↑
context ↑
batch ↑

👉 memory traffic ≈ O(N)

Compute scaling:

👉 O(N log N)

👉 memory 變 bottleneck


⭐ 六、Energy economics(最深原因)

移動 32bit:

raw-image

👉 memory access ≫ compute

HBM 目標:

👉 降低 memory energy


⭐ 七、為何 GDDR 不行

raw-image

👉 GDDR 是 PCB memory

👉 HBM 是 package memory


⭐ 八、最直觀理解

🔷 GDDR

👉 memory 在城市外

👉 要開高速公路


🔷 HBM

👉 memory 在 CPU 旁

👉 走小路

👉 latency ↓

👉 energy ↓

👉 bandwidth ↑


⭐ 九、一句話物理結論

AI GPU 必須 HBM,因為 memory movement energy dominates compute energy,而 HBM 是唯一能降低 movement energy 的封裝技術


⭐ 十、延伸前沿(非常重要)

HBM 之後:

  • HBM4
  • optical memory link
  • wafer-scale memory
  • memory fabric

👉 AI computing → memory-centric computing




留言
avatar-img
sirius數字沙龍
15會員
313內容數
吃自助火鍋啦!不要客氣,想吃啥,請自行取用!
sirius數字沙龍的其他內容
2026/02/23
🟩 NVIDIA AI Scale Roadmap (H100 → H200 → B200 → GB200 → Rubin) 這條 roadmap 是近年 AI 基礎設施最重要技術演進之一。 本質是一條: AI 模型 scaling 需求 → GPU 架構 → 系統級算力 演化鏈。
Thumbnail
2026/02/23
🟩 NVIDIA AI Scale Roadmap (H100 → H200 → B200 → GB200 → Rubin) 這條 roadmap 是近年 AI 基礎設施最重要技術演進之一。 本質是一條: AI 模型 scaling 需求 → GPU 架構 → 系統級算力 演化鏈。
Thumbnail
2026/02/23
🟩 NVIDIA 全 GPU Hierarchy (RTX 5090 → RTX Pro → H200 → B200 → GB200) NVIDIA GPU 並不是單一產品線,而是完整算力層級架構。 可理解為: PC → 工作站 → 單卡 AI → AI 基礎設施 → AI 超級系統
Thumbnail
2026/02/23
🟩 NVIDIA 全 GPU Hierarchy (RTX 5090 → RTX Pro → H200 → B200 → GB200) NVIDIA GPU 並不是單一產品線,而是完整算力層級架構。 可理解為: PC → 工作站 → 單卡 AI → AI 基礎設施 → AI 超級系統
Thumbnail
2026/02/23
🟩 NVIDIA RTX 5090 vs B200 完整比較 這兩張 GPU 雖然同屬 Blackwell 架構,但定位完全不同: RTX 5090 → 消費級 / 工作站 / 遊戲 / 本地 AI B200 → 資料中心 / AI 訓練 / 超級算力
Thumbnail
2026/02/23
🟩 NVIDIA RTX 5090 vs B200 完整比較 這兩張 GPU 雖然同屬 Blackwell 架構,但定位完全不同: RTX 5090 → 消費級 / 工作站 / 遊戲 / 本地 AI B200 → 資料中心 / AI 訓練 / 超級算力
Thumbnail
看更多
你可能也想看
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
看完上篇 4 位新成員的靈魂拷問,是不是意猶未盡?別急,野格團新血的驚喜正接著登場!今天下篇接力的另外 4 位「個人主題專家」,戰力同樣驚人──領域從旅行美食、運動、商業投資到自我成長;這些人如何維持長跑般的創作動力?在爆紅的文章背後,又藏著哪些不為人知的洞察?5 大靈魂拷問繼續出擊
Thumbnail
看完上篇 4 位新成員的靈魂拷問,是不是意猶未盡?別急,野格團新血的驚喜正接著登場!今天下篇接力的另外 4 位「個人主題專家」,戰力同樣驚人──領域從旅行美食、運動、商業投資到自我成長;這些人如何維持長跑般的創作動力?在爆紅的文章背後,又藏著哪些不為人知的洞察?5 大靈魂拷問繼續出擊
Thumbnail
愛與恨之間 便是戀人 極其感傷的距離
Thumbnail
愛與恨之間 便是戀人 極其感傷的距離
Thumbnail
你我之間的距離 無法用尺丈量 要用被思念懊悔 不斷折磨的失眠
Thumbnail
你我之間的距離 無法用尺丈量 要用被思念懊悔 不斷折磨的失眠
Thumbnail
怎樣的距離才是最佳的距離,有時加速有時滑行偶而煞車,不疾不徐隨著心的節奏前進,不斷變動也不斷調整,沒有固定答案變數太多,只能自己親身體會,慢慢摸索不用著急,記得保持彈性多點伸縮空間,會讓人生的旅途多份自在。
Thumbnail
怎樣的距離才是最佳的距離,有時加速有時滑行偶而煞車,不疾不徐隨著心的節奏前進,不斷變動也不斷調整,沒有固定答案變數太多,只能自己親身體會,慢慢摸索不用著急,記得保持彈性多點伸縮空間,會讓人生的旅途多份自在。
Thumbnail
你們痛的鋒利有一樣的質地 轉身的方式壞的同個樣子 然後你明白誰離開誰其實沒什麼分別 你們終究擁有同樣的距離
Thumbnail
你們痛的鋒利有一樣的質地 轉身的方式壞的同個樣子 然後你明白誰離開誰其實沒什麼分別 你們終究擁有同樣的距離
Thumbnail
冷淡的話語是 無可挽回的距離
Thumbnail
冷淡的話語是 無可挽回的距離
Thumbnail
人與人的距離有多遠?或者說,該要多遠?? 已經不知道有幾次在電梯裡前面的人毫無知覺的將頭髮往站在後方的我臉上送,或是,看表演時旁邊的長髮女郎無意識地甩動頭髮,無視於鄰座的臉就在旁邊,還有,在小七排隊結帳時,後面的阿姨總是黏得緊緊的。 喔,真是令人無法忍受,生物都是需要有自己的“領地“的,人當然也不
Thumbnail
人與人的距離有多遠?或者說,該要多遠?? 已經不知道有幾次在電梯裡前面的人毫無知覺的將頭髮往站在後方的我臉上送,或是,看表演時旁邊的長髮女郎無意識地甩動頭髮,無視於鄰座的臉就在旁邊,還有,在小七排隊結帳時,後面的阿姨總是黏得緊緊的。 喔,真是令人無法忍受,生物都是需要有自己的“領地“的,人當然也不
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News