vocus logo

方格子 vocus

NVIDIA GB300 GPU深度解析:chiplet架構、HBM3e與NVLink的系統級挑戰

更新 發佈閱讀 5 分鐘

今年 GTC 2024,NVIDIA 發表的 Blackwell 架構核心,也就是所謂的 GB300 GPU,基本上是接續 H100(Hopper 架構)的下一代產品。以系統的角度來看,這一代不只是單純的效能升級,更是從架構層面開始做根本性調整,有幾個關鍵變化值得注意。

首先,GB300 是一顆 chiplet 架構的 GPU。也就是說,它不再像 H100 那樣是一顆大單die,而是採用 multi-die 設計,主要由兩顆 compute die(B100)組成,中間透過 Ultra-High Bandwidth Die-to-Die Interconnect 相連接。這表示 NVIDIA 從單晶片走向模組化邏輯,可能是在晶圓尺寸與良率之間做了取捨。

其次,GB300 本身支援 HBM3e 記憶體,最多可以接到 192GB 的容量,這對於處理大模型(尤其是LLM)會有非常大的幫助。而它內建的第六代 NVLink,也在做 die-to-die 與 GPU-to-GPU 通訊時提供更高頻寬與更低延遲,這點對我們在主板設計上要考慮的 routing 與物理 layout 是非常直接的挑戰。

總結一下,這篇短文會先聚焦在 GB300 這顆核心 GPU 的設計邏輯,包括它的 chiplet 結構、記憶體通道、互連設計等等,再逐步延伸到它在模組(如GB200)、伺服器、資料中心等應用的落實情況。畢竟對我們做系統的人來說,你只有真正搞懂核心元件,才談得上做出相容穩定又高效能的系統。


2.硬體架構拆解:從Die設計到封裝進化

講到 GB300 的架構,我們第一個會注意到的就是——這已經不是一顆單一大Die的GPU了。這代NVIDIA直接走上了 chiplet(多晶粒)設計路線,這點對我們做系統端、尤其是server主板設計的RD來說,代表非常多「背後藏著的麻煩」跟「換來的性能提升」。

2.1 製程與封裝設計:TSMC 4NP + Chiplet + CoWoS-L

GB300 採用的是 TSMC 的 4NP 製程(基本上是 4N 的優化版本),搭配 NVIDIA 的 CoWoS-L 封裝技術。不同於 H100 的單一大晶粒設計,GB300 是由兩顆 Compute Die(B100 Die) 所組成,這兩顆die之間透過內部的高頻寬互連橋接起來。

📌 CoWoS-L 是什麼?

這是一種類似英特爾EMIB的 2.5D 封裝方式,允許多個 die 坐在同一個中介層(interposer)上共享高速連接資源。這對於高頻訊號完整性、routing 長度與熱分布是相當關鍵的。

2.2 Compute Die 結構:2x Die + 內部Interconnect

從目前公開資訊推估,GB300 每顆 die 內部搭載了全新的 Streaming Multiprocessor(SM)模組設計,而且強化了 Transformer Engine 的計算能力。這代的 Tensor Core 進一步優化了對 FP8 的支援,也內建更多 Matrix Multiply Acceleration(MMA)路徑。

  • 單一GB300 擁有 208 Billion transistors,整體架構為左右兩顆 die 組成。
  • 每顆 die 擁有獨立的 cache 層級與記憶體控制器(但透過共享協定可以互通)
  • 內部透過 NV-HBI (High Bandwidth Interconnect) 串接,NVIDIA 聲稱達成 <600ps latency。

這代表我們在設計 PCB 或模組時,不用處理兩個die之間的實體連接線路,但系統端要預期其內部資料流會有某些潛在同步 bottleneck

2.3 HBM 記憶體:支援 HBM3e、最多192GB

GB300 搭配的是新一代 HBM3e,頻寬高達每顆記憶體3.2 Tbps,最高支援到 6個堆疊通道(stack),單卡可達到 192GB 容量。

  • 相較於 H100 的 HBM3(最多80GB),這代幾乎是倍數提升。
  • 因為採用 chiplet 設計,每顆 die 旁邊各自佈局三個 HBM stack,這點在封裝面會影響散熱模組的均熱設計與 VRM 擺位。

這意味著板子上的 HBM layout 設計會更吃空間,與散熱模組的干涉可能性更高,不處理好會直接影響熱點集中與長時間功耗表現。

2.4 NVLink 第四代:GPU-to-GPU互連再升級

GB300內建的第四代NVLink,單一GPU就支援最多 18個NVLink通道,總頻寬超過 1.8TB/s。對於未來多卡系統來說,這個升級非常關鍵:

  • 多卡資料同步的時間減少(特別是多節點LLM訓練)
  • GPU之間資料傳輸不再依賴PCIe為主路徑(可避開瓶頸)
  • 伺服器/模組之間要多考慮 NVLink bridge、switch placement 與 routing 規劃

這也解釋為什麼 NVIDIA 要推出獨立的 NVLink Switch Die(在GB200模組裡),來整合大規模 GPU mesh。系統廠要導入這種解決方案,等於不只是要有NVLink bridge,還得搞定switch fabric layout與熱設計平衡


留言
avatar-img
迷茫人生的沙龍
9會員
52內容數
想發什麼就發的人,就如同我的名稱
迷茫人生的沙龍的其他內容
2025/03/28
這篇文章淺顯易懂地介紹了人工智慧的基礎概念,從 AI 的優缺點、運作原理到常見的 AI 技術與應用,讓讀者瞭解 AI 的能力與限制,並強調在 AI 時代懂得運用 AI 的重要性。
Thumbnail
2025/03/28
這篇文章淺顯易懂地介紹了人工智慧的基礎概念,從 AI 的優缺點、運作原理到常見的 AI 技術與應用,讓讀者瞭解 AI 的能力與限制,並強調在 AI 時代懂得運用 AI 的重要性。
Thumbnail
2024/11/24
NVIDIA的GB200架構提供了強大的計算能力,專為深度學習和高效能計算設計。這篇文章深入探討其硬體架構、數據傳輸技術、能效與冷卻系統、以及豐富的軟體支援,讓開發者能夠最大化利用這一平臺。此外,還介紹了基於GB200的實際應用案例,包括自然語言處理和計算機視覺,顯示其在現代計算需求中的卓越性能。
Thumbnail
2024/11/24
NVIDIA的GB200架構提供了強大的計算能力,專為深度學習和高效能計算設計。這篇文章深入探討其硬體架構、數據傳輸技術、能效與冷卻系統、以及豐富的軟體支援,讓開發者能夠最大化利用這一平臺。此外,還介紹了基於GB200的實際應用案例,包括自然語言處理和計算機視覺,顯示其在現代計算需求中的卓越性能。
Thumbnail
2024/03/13
2024/03/13
看更多
你可能也想看
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
NVIDIA 的 GB300 GPU 作為 H100 的繼任者,採用創新的 chiplet 架構,帶來效能與設計上的重大變革。本文深入探討其 chiplet 結構、HBM3e 記憶體、NVLink 第四代互連設計等核心技術,並分析其對伺服器主板設計與系統整合帶來的挑戰與影響。
Thumbnail
NVIDIA 的 GB300 GPU 作為 H100 的繼任者,採用創新的 chiplet 架構,帶來效能與設計上的重大變革。本文深入探討其 chiplet 結構、HBM3e 記憶體、NVLink 第四代互連設計等核心技術,並分析其對伺服器主板設計與系統整合帶來的挑戰與影響。
Thumbnail
Nvidia(輝達)是一家全球領先的圖形處理單元(GPU)製造商,近期在台灣和國際掀起一股旋風。 其成長歷程展示了技術創新和市場戰略的成功結合。以下是Nvidia企業成長的歷程簡述: 早期階段(1993-2000) Nvidia於1993年由黃仁勳(Jensen Huang)、Ch
Thumbnail
Nvidia(輝達)是一家全球領先的圖形處理單元(GPU)製造商,近期在台灣和國際掀起一股旋風。 其成長歷程展示了技術創新和市場戰略的成功結合。以下是Nvidia企業成長的歷程簡述: 早期階段(1993-2000) Nvidia於1993年由黃仁勳(Jensen Huang)、Ch
Thumbnail
NVIDIA(英偉達)作為全球領先的圖形處理器(GPU)製造商,不僅在遊戲市場佔有重要地位,還在專業圖形和高性能計算領域擁有強大的產品線。
Thumbnail
NVIDIA(英偉達)作為全球領先的圖形處理器(GPU)製造商,不僅在遊戲市場佔有重要地位,還在專業圖形和高性能計算領域擁有強大的產品線。
Thumbnail
NVIDIA的新目標是成為支援企業開發AI應用程式的「AI晶圓代工」,提供技術、專業知識和基礎設施,幫助實現AI應用。具體而言,NVIDIA將提供GPU、自主CPU「Grace」、超級計算機及其硬體,還有軟體和工具,以滿足客戶需求。
Thumbnail
NVIDIA的新目標是成為支援企業開發AI應用程式的「AI晶圓代工」,提供技術、專業知識和基礎設施,幫助實現AI應用。具體而言,NVIDIA將提供GPU、自主CPU「Grace」、超級計算機及其硬體,還有軟體和工具,以滿足客戶需求。
Thumbnail
隨著人工智慧技術的快速發展,生成式AI(Generative AI)時代已經來臨。在台北國際電腦展(Computex)上,NVIDIA創辦人暨執行長黃仁勳正式發布了新一代Blackwell GPU架構,標誌著這個新紀元的到來。
Thumbnail
隨著人工智慧技術的快速發展,生成式AI(Generative AI)時代已經來臨。在台北國際電腦展(Computex)上,NVIDIA創辦人暨執行長黃仁勳正式發布了新一代Blackwell GPU架構,標誌著這個新紀元的到來。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
NVIDIA在人工智慧處理專用GPU領域的地位牢固,但面臨著來自英特爾和超微半導體等競爭對手的反擊。新興企業也加入競爭,使得競爭更加激烈。未來,合作關係將變得至關重要,NVIDIA和其他競爭對手在激烈的競爭中脫穎而出的關鍵。
Thumbnail
NVIDIA在人工智慧處理專用GPU領域的地位牢固,但面臨著來自英特爾和超微半導體等競爭對手的反擊。新興企業也加入競爭,使得競爭更加激烈。未來,合作關係將變得至關重要,NVIDIA和其他競爭對手在激烈的競爭中脫穎而出的關鍵。
Thumbnail
筆記-24.03.25-科技財知道 *輝達想做的事情非常多,包括AI GPU的算力提供(GB200)、協助半導體製造(cuLitho)、車用晶片(Drive Thor)、機器人開發平台(GR00T)、元宇宙等物理模擬(Omniverse)。 *GB200 = 2個B100+1個Grace CPU
Thumbnail
筆記-24.03.25-科技財知道 *輝達想做的事情非常多,包括AI GPU的算力提供(GB200)、協助半導體製造(cuLitho)、車用晶片(Drive Thor)、機器人開發平台(GR00T)、元宇宙等物理模擬(Omniverse)。 *GB200 = 2個B100+1個Grace CPU
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News