HBM (High Bandwidth Memory) 是什麼?

更新於 發佈於 閱讀時間約 11 分鐘
投資理財內容聲明
raw-image



HBM,全稱 High Bandwidth Memory(高頻寬記憶體),是一種專為高性能計算設計的先進記憶體技術。它以 3D 堆疊 為核心,能夠提供極高的數據傳輸頻寬,同時降低功耗和佔用空間,成為人工智慧(AI)、高效能計算(HPC)和高端 GPU 的首選記憶體。

HBM 的核心特點

  1. 3D 堆疊設計
    • 將多層 DRAM 晶片垂直堆疊在一起,透過 TSV(Through-Silicon Via,矽通孔) 技術連接每層晶片,實現高速數據傳輸。
  2. 高頻寬
    • 每層 DRAM 晶片之間的通訊距離極短,數據傳輸速度可以達到 每秒數百 GB。
  3. 低功耗
    • 記憶體模組和處理器(如 GPU)之間的數據傳輸耗能更低,對比傳統 GDDR 記憶體,功耗降低約 50%。
  4. 緊密集成
    • HBM 記憶體直接堆疊在 GPU 或處理器旁邊,佔用面積極小,適合空間受限的應用(如 HPC、AI 訓練晶片)。


HBM 的演進歷程

HBM 技術從 2013 年推出至今,已經歷多次演進,每一代性能逐步提升:

1. HBM (第一代,2013 年)

  • 推出廠商:SK Hynix 和 AMD(共同開發)。
  • 關鍵技術
    • 首次採用 TSV 技術堆疊多層 DRAM 晶片。
    • 單顆模組頻寬達 128GB/s。
    • 每個 HBM 堆疊最大容量為 4GB。
  • 應用
    • AMD Fury X GPU(全球首款使用 HBM 的顯示卡)。

2. HBM2 (第二代,2016 年)

  • 推出廠商:SK Hynix、三星。
  • 關鍵技術
    • 每層 DRAM 的容量提升,單個模組頻寬達 256GB/s(翻倍)。
    • 最大容量可達 8GB(每個堆疊)。
    • 支援更高層數的堆疊(最高 8 層)。
  • 應用
    • NVIDIA Tesla P100(Pascal 架構,專為 HPC 設計)。
    • AMD Vega GPU(消費級市場使用 HBM2)。
    • AI 和 HPC 晶片逐步採用 HBM2。

3. HBM2E (第三代,2018 年)

  • 推出廠商:三星、SK Hynix。
  • 關鍵技術
    • 在 HBM2 的基礎上進一步提升容量和頻寬。
    • 單顆模組頻寬達 460GB/s,比 HBM2 提升約 80%。
    • 單個堆疊的容量提升至 16GB。
  • 應用
    • NVIDIA A100(Ampere 架構,用於 AI 訓練)。
    • AMD Instinct MI100(HPC 和 AI 加速器)。

4. HBM3 (第四代,2021 年)

  • 推出廠商:三星、SK Hynix。
  • 關鍵技術
    • 支援更高層數堆疊(最高 12 層),單堆疊容量可達 24GB。
    • 單顆模組頻寬突破 819GB/s,為 HBM2E 的兩倍。
    • 更低功耗,適合更高效能的 AI 和 HPC。
  • 應用
    • NVIDIA H100(Hopper 架構)。
    • AMD Instinct MI300(CPU+GPU 整合產品)。
    • Intel Ponte Vecchio(超算加速器)。

5. HBM3e (第五代,2024 年預計量產)

  • 推出廠商:SK Hynix。
  • 關鍵技術
    • 預計提升頻寬至 1.2TB/s(每模組),再創新高。
    • 提供更大容量(單堆疊容量超過 32GB)。
    • 設計針對下一代 AI 晶片和 HPC 的超高需求優化。
  • 應用
    • 預計應用於 NVIDIA B100 晶片(Blackwell 架構)。

HBM 的主要應用領域

  1. 人工智慧(AI)
    • AI 訓練和推理需要超高頻寬和低延遲,HBM 是目前的首選。
    • 代表應用:NVIDIA H100、AMD Instinct MI300。
  2. 高效能運算(HPC)
    • 超算中心需要快速處理大規模數據,HBM 提供高頻寬支持。
    • 代表應用:Intel Ponte Vecchio。
  3. 顯示卡與遊戲 GPU
    • 高端顯示卡(如 AMD Vega 系列)曾經採用 HBM,雖然現已主要被 GDDR 替代,但仍是部分專業 GPU 的選擇。
  4. 伺服器與資料中心
    • 雲端伺服器的 AI 模型訓練和數據分析使用 HBM 提升效率。



單堆疊容量 是指 一個 HBM 模組內的記憶體總容量。這個容量來自多層 DRAM 晶片的垂直堆疊。


1. HBM 的結構簡單介紹

HBM(High Bandwidth Memory)是一種 3D 堆疊記憶體,每個模組由多層記憶體晶片(DRAM Die)垂直堆疊而成。

  • 每層 DRAM 晶片有固定的容量(例如 1GB 或 2GB)。
  • 多層 DRAM 晶片透過 TSV(Through-Silicon Via,矽通孔) 技術連接,形成一個緊密的堆疊模組。
  • 這個完整的堆疊稱為一個 HBM 堆疊

2. 單堆疊容量怎麼計算?

單堆疊容量由以下公式決定: 單堆疊容量=每層晶片容量×堆疊層數\text{單堆疊容量} = \text{每層晶片容量} \times \text{堆疊層數}單堆疊容量=每層晶片容量×堆疊層數

例子

  • 如果每層 DRAM 晶片容量是 2GB,堆疊 4 層: 2GB×4=8GB2GB \times 4 = 8GB2GB×4=8GB 單個 HBM 堆疊容量是 8GB
  • 如果每層 DRAM 晶片容量是 4GB,堆疊 6 層: 4GB×6=24GB4GB \times 6 = 24GB4GB×6=24GB 單個 HBM 堆疊容量是 24GB

3. 單堆疊容量與 HBM 記憶體性能的關係

  • 容量: 單堆疊容量越大,處理器(如 GPU 或 CPU)可以同時存取更多數據,適合處理 AI 訓練或 HPC 任務。
  • 頻寬: 每個堆疊的頻寬由內部晶片層數和互聯速度決定。例如:
    • HBM2 支援頻寬 256GB/s。
    • HBM3 支援頻寬 819GB/s。 單堆疊容量越大,頻寬需求也越高。


raw-image

簡單比喻

  • 想像 HBM 堆疊是一棟高樓,每層樓存放數據。
  • 單堆疊容量 就是這棟樓能存放的總數據量。
  • 如果每層樓(DRAM 晶片)能存更多東西,或者樓層數增加,這棟樓的總容量就會更大。


需要那麼大的 HBM 容量,是為了滿足以下幾個高性能應用場景的需求,這些應用需要處理大量的數據,並且需要高速度和高效能來支持:


1. 人工智慧(AI)訓練

  • 需求原因
    • 訓練大型 AI 模型(如 GPT-4、GPT-5)需要處理海量數據和參數。
    • 模型的參數量通常以 十億到兆(billion to trillion)計算,這些參數需要大量記憶體來存儲和快速訪問。
  • 需要大容量 HBM 的原因
    • 訓練數據需要在記憶體中快速調用,容量越大,數據讀取和交換越快,避免瓶頸。
    • 舉例:NVIDIA H100 使用 HBM3 24GB 單堆疊,總計最多可達 192GB 記憶體,適合處理 GPT 等巨型模型。

2. 高效能運算(HPC)

  • 需求原因
    • 超算需要進行大規模科學模擬、基因分析、氣候預測等任務。
    • 這些應用需要快速處理大量數據,並保持高效能。
  • 需要大容量 HBM 的原因
    • 模擬時需要處理數以 PB(PetaBytes) 計的數據,大容量 HBM 提供快速存取和計算支持。
    • 舉例:Intel Ponte Vecchio GPU 在 HPC 應用中使用多個 HBM3 堆疊來提升運算效率。

3. 即時推理

  • 需求原因
    • 生成式 AI(如 ChatGPT)在推理時需要同時存取大量模型參數,特別是在處理多用戶請求時。
    • AI 模型推理需要快速存取數據,避免延遲。
  • 需要大容量 HBM 的原因
    • 即時推理需要將模型參數和數據同時存入 HBM,減少數據在記憶體和硬碟之間傳輸的時間。
    • 舉例:Amazon 和 Google 的資料中心中使用 HBM 支持 AI 推理工作負載。

4. 3D 渲染與視覺運算

  • 需求原因
    • 電影製作、遊戲設計和工程模擬等需要處理大量圖形數據和材質。
    • 高分辨率 3D 場景渲染需要記憶體支持大量並行數據運算。
  • 需要大容量 HBM 的原因
    • 在記憶體中存儲整個場景、材質和紋理數據,能減少存取延遲並提升渲染速度。
    • 舉例:高端顯卡(如 NVIDIA Quadro 系列)使用 HBM 支持 3D 渲染。

5. 基因分析與生物信息學

  • 需求原因
    • 基因測序、蛋白質折疊計算需要處理數據量非常龐大。
    • 記憶體容量不足可能導致數據處理速度過慢。
  • 需要大容量 HBM 的原因
    • 需要快速存取並處理高頻數據,尤其在藥物設計和生物信息學研究中。
    • 舉例:超算中心的 HPC 工作負載中,使用多層 HBM 支持基因分析。

6. 雲端伺服器與資料中心

  • 需求原因
    • 雲端服務商(如 Amazon AWS、Google Cloud)需要同時處理多個客戶的數據和計算需求。
  • 需要大容量 HBM 的原因
    • 支持多任務並行執行,保證每個客戶的工作負載能快速完成。
    • 大容量 HBM 提高記憶體帶寬,避免數據交換瓶頸。
    • 舉例:NVIDIA H100 的 HBM 為大型雲端資料中心的 AI 模型提供高效能支持。

7. 自動駕駛與邊緣計算

  • 需求原因
    • 自動駕駛汽車需要處理來自多個感測器(攝像頭、雷達、LIDAR)的數據,同時進行即時分析和決策。
  • 需要大容量 HBM 的原因
    • 感測器數據流量非常大,HBM 可以將數據緊密存儲並快速處理。
    • 舉例:NVIDIA Orin 平台在自動駕駛中使用高帶寬記憶體來提升計算能力。


簡單比喻

  • 如果把 HBM 比作辦公桌,容量越大的辦公桌能同時放下更多的檔案:
    • 小容量記憶體:需要頻繁從檔案櫃(硬碟)來回搬資料,效率低。
    • 大容量 HBM:能一次性放下整個檔案,所有檔案都在手邊,工作更快。

總結

需要大容量 HBM 是因為現代應用(特別是 AI 和 HPC)需要:

  1. 同時處理大量數據。
  2. 確保數據訪問速度快,減少延遲。
  3. 支持高效能、並行計算。

隨著 AI 模型和計算需求的增長,HBM 的大容量和高頻寬特性會變得越來越重要。

留言
avatar-img
留言分享你的想法!
維那思-avatar-img
2025/04/08
解密記憶體:揭秘DRAM、Flash背後的產業鏈提及了這篇文章,趕快過去看看吧!
avatar-img
DA的美股日記
6會員
294內容數
DA的美股日記的其他內容
2025/04/26
✅ 什麼是「貨幣市場基金」? 貨幣市場基金是一種非常低風險的投資工具,主要投資在: 短期國庫券(T-bills) 銀行定存 短期政府或高信評企業的商業票據 它的特性是: 收益穩定但很低 隨時可以提領(高度流動性) 是現金的替代品,投資人常用來暫停觀望、停泊資金 📉 如果「大量流
2025/04/26
✅ 什麼是「貨幣市場基金」? 貨幣市場基金是一種非常低風險的投資工具,主要投資在: 短期國庫券(T-bills) 銀行定存 短期政府或高信評企業的商業票據 它的特性是: 收益穩定但很低 隨時可以提領(高度流動性) 是現金的替代品,投資人常用來暫停觀望、停泊資金 📉 如果「大量流
2025/03/29
✅ DPI 是什麼? 它是指一個人 收到的總收入 扣除 個人所得稅後,真正可以自由支配來消費或儲蓄的收入。 🔍 舉例說明: 假設你這個月收入為 $5,000 你繳了 $1,000 的所得稅 那你的 DPI 就是: 這 $4,000 就是你可以拿來: 消費(吃飯、旅遊、買衣服)
2025/03/29
✅ DPI 是什麼? 它是指一個人 收到的總收入 扣除 個人所得稅後,真正可以自由支配來消費或儲蓄的收入。 🔍 舉例說明: 假設你這個月收入為 $5,000 你繳了 $1,000 的所得稅 那你的 DPI 就是: 這 $4,000 就是你可以拿來: 消費(吃飯、旅遊、買衣服)
2025/03/29
🔹 1. PCE Price Index(個人消費支出物價指數)是「物價變化率」的指標 PCE = Personal Consumption Expenditures PCE Price Index 反映的是「你買的東西變貴了多少?」 ✅ 舉例說明: 假設你這個月花了100元買東西,跟上個
2025/03/29
🔹 1. PCE Price Index(個人消費支出物價指數)是「物價變化率」的指標 PCE = Personal Consumption Expenditures PCE Price Index 反映的是「你買的東西變貴了多少?」 ✅ 舉例說明: 假設你這個月花了100元買東西,跟上個
看更多
你可能也想看
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
半導體與人工智慧的關係 半導體的基礎角色 半導體是現代電子設備的核心組件,為各種技術的發展提供了基礎。隨著人工智慧(AI)的興起,半導體在數據處理和計算能力方面的需求急劇增加。AI應用需要強大的計算能力來處理大量數據,這使得專門設計的半導體晶片變得至關重要。 AI對半導體設計的影響 AI不僅
Thumbnail
半導體與人工智慧的關係 半導體的基礎角色 半導體是現代電子設備的核心組件,為各種技術的發展提供了基礎。隨著人工智慧(AI)的興起,半導體在數據處理和計算能力方面的需求急劇增加。AI應用需要強大的計算能力來處理大量數據,這使得專門設計的半導體晶片變得至關重要。 AI對半導體設計的影響 AI不僅
Thumbnail
NVIDIA的GB200架構提供了強大的計算能力,專為深度學習和高效能計算設計。這篇文章深入探討其硬體架構、數據傳輸技術、能效與冷卻系統、以及豐富的軟體支援,讓開發者能夠最大化利用這一平臺。此外,還介紹了基於GB200的實際應用案例,包括自然語言處理和計算機視覺,顯示其在現代計算需求中的卓越性能。
Thumbnail
NVIDIA的GB200架構提供了強大的計算能力,專為深度學習和高效能計算設計。這篇文章深入探討其硬體架構、數據傳輸技術、能效與冷卻系統、以及豐富的軟體支援,讓開發者能夠最大化利用這一平臺。此外,還介紹了基於GB200的實際應用案例,包括自然語言處理和計算機視覺,顯示其在現代計算需求中的卓越性能。
Thumbnail
HBM,全稱 High Bandwidth Memory(高頻寬記憶體),是一種專為高性能計算設計的先進記憶體技術。它以 3D 堆疊 為核心,能夠提供極高的數據傳輸頻寬,同時降低功耗和佔用空間,成為人工智慧(AI)、高效能計算(HPC)和高端 GPU 的首選記憶體。 HBM 的核心特點
Thumbnail
HBM,全稱 High Bandwidth Memory(高頻寬記憶體),是一種專為高性能計算設計的先進記憶體技術。它以 3D 堆疊 為核心,能夠提供極高的數據傳輸頻寬,同時降低功耗和佔用空間,成為人工智慧(AI)、高效能計算(HPC)和高端 GPU 的首選記憶體。 HBM 的核心特點
Thumbnail
H100 架構:Hopper 架構(針對 AI 訓練與推理的 GPU)。 製程:台積電 4nm 製程。 電晶體數量:約 800 億。 記憶體: 支援 HBM3 記憶體,容量最大達 80GB。 設計:單一晶片(非 Chiplet)。 主要應用: AI 訓練與推理。 高效能運算(HPC
Thumbnail
H100 架構:Hopper 架構(針對 AI 訓練與推理的 GPU)。 製程:台積電 4nm 製程。 電晶體數量:約 800 億。 記憶體: 支援 HBM3 記憶體,容量最大達 80GB。 設計:單一晶片(非 Chiplet)。 主要應用: AI 訓練與推理。 高效能運算(HPC
Thumbnail
摘要 過去十年,DRAM 的發展遇到了瓶頸,密度提升緩慢,成本降低有限,嚴重阻礙了需要大量記憶體資源的 AI 計算發展。為了克服這個「記憶體牆」問題,短期內可以通過 4F2 單元佈局、垂直通道電晶體 (VCT) 和 HBM 等技術改進現有 DRAM 效能。長期來看,開發嵌入式運算記憶體 (CIM)
Thumbnail
摘要 過去十年,DRAM 的發展遇到了瓶頸,密度提升緩慢,成本降低有限,嚴重阻礙了需要大量記憶體資源的 AI 計算發展。為了克服這個「記憶體牆」問題,短期內可以通過 4F2 單元佈局、垂直通道電晶體 (VCT) 和 HBM 等技術改進現有 DRAM 效能。長期來看,開發嵌入式運算記憶體 (CIM)
Thumbnail
NVIDIA 黃仁勳 - AI人工智慧時代如何帶動全球新產業革命(個人紀錄用) 🇺🇸Omniverse 就是未來集大成,而加速運算、人工智慧就是兩個最重要的技術核心 🇺🇸CPU效能的擴充速度正在大幅降低,提出「運算通膨」概念
Thumbnail
NVIDIA 黃仁勳 - AI人工智慧時代如何帶動全球新產業革命(個人紀錄用) 🇺🇸Omniverse 就是未來集大成,而加速運算、人工智慧就是兩個最重要的技術核心 🇺🇸CPU效能的擴充速度正在大幅降低,提出「運算通膨」概念
Thumbnail
上篇文章,我們談到華碩的雲端轉型歷程。這篇文章談的宏碁,其實也在 2018 年展開了為期三年的數位轉型計畫,將 IT 系統從原本兩個區域的 data center 搬上雲端,這麼做的目的,除了要讓 IT 系統能方便地應用機器學習和 AI 等新興科技外,也想要藉此降低 IT 系統維護成本,以及提高對抗
Thumbnail
上篇文章,我們談到華碩的雲端轉型歷程。這篇文章談的宏碁,其實也在 2018 年展開了為期三年的數位轉型計畫,將 IT 系統從原本兩個區域的 data center 搬上雲端,這麼做的目的,除了要讓 IT 系統能方便地應用機器學習和 AI 等新興科技外,也想要藉此降低 IT 系統維護成本,以及提高對抗
Thumbnail
本文作者美籍港裔的黃漢森和(Philip Wong)和Jim Plummer都是史丹佛大學的電機科學家,在這本《矽三角:美中台與全球半導體安全》的論文集中,首先就由他們兩位通曉半導體技術面的專家從整個半導體產業的範圍、美國國防部對晶片的特殊需求、全球半導體產業鏈的區域分工與各區優劣勢等方面進行介紹
Thumbnail
本文作者美籍港裔的黃漢森和(Philip Wong)和Jim Plummer都是史丹佛大學的電機科學家,在這本《矽三角:美中台與全球半導體安全》的論文集中,首先就由他們兩位通曉半導體技術面的專家從整個半導體產業的範圍、美國國防部對晶片的特殊需求、全球半導體產業鏈的區域分工與各區優劣勢等方面進行介紹
Thumbnail
如果這篇文章裡面的內容都已經price in了,僅供想了解產業及科技的人參考。不構成任何投資建議。 未來趨勢 CoWoS 已經外包了。 CoWoS 有幾種變體,但原始 CoWoS-S 仍然是大批量生產中的唯一配置。這是如上所述的經典配置:邏輯芯片 + HBM 芯片通過帶有 TSV 的矽基中介層
Thumbnail
如果這篇文章裡面的內容都已經price in了,僅供想了解產業及科技的人參考。不構成任何投資建議。 未來趨勢 CoWoS 已經外包了。 CoWoS 有幾種變體,但原始 CoWoS-S 仍然是大批量生產中的唯一配置。這是如上所述的經典配置:邏輯芯片 + HBM 芯片通過帶有 TSV 的矽基中介層
Thumbnail
常常有人在問,為什麼這幾年人工智慧會突然爆紅?原因有非常的多,但如果單以”技術”的角度來看,這幾年科技的發展剛好滿足了人工智慧的三個基本需求─算法、算力及資料...
Thumbnail
常常有人在問,為什麼這幾年人工智慧會突然爆紅?原因有非常的多,但如果單以”技術”的角度來看,這幾年科技的發展剛好滿足了人工智慧的三個基本需求─算法、算力及資料...
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News