2024-06-16|閱讀時間 ‧ 約 24 分鐘

拐點 #011: 新一代黃金 H100

NVIDIA(英偉達)作為全球領先的圖形處理器(GPU)製造商,不僅在遊戲市場佔有重要地位,還在專業圖形和高性能計算領域擁有強大的產品線。

NVIDIA的三類GPU產品

1. 遊戲顯卡:Geforce系列

NVIDIA最早以遊戲顯卡產品起家,產品型號通常以Geforce命名。這些顯卡專為遊戲愛好者和PC遊戲玩家設計,提供優異的圖形性能和流暢的遊戲體驗。

2. 專業圖形卡:Quadro系列

Quadro系列專為專業圖形、影視製作和動畫製作公司打造,能夠支持高性能的圖形處理和精確的色彩表現,廣泛應用於電影製作、工程設計等領域。

3. 計算卡:Tesla系列

Tesla系列是NVIDIA針對高性能計算(HPC)、超級計算和數據中心設計的GPU產品。這些卡以高效的並行計算能力和大規模數據處理能力著稱,能夠支持複雜的科學計算和AI應用。

NVIDIA H100:專為AI而生的下一代計算卡

從2017年起,NVIDIA的計算卡,特別是Tesla系列,經歷了快速的發展。最初,這些卡主要用於科學計算,但近幾年,隨著AI訓練和推理需求的急劇增長,它們已經成為NVIDIA收入的主要來源。最新推出的H100 GPU就是為滿足這種需求而設計的。

NVIDIA H100 Tensor


硬件設計的進化

H100相比前代產品(如A100)有了顯著的改進。它採用了成本更高、帶寬更大的HBM显存,显存容量可达数十GB到120GB,遠高於傳統遊戲顯卡。此外,取消了光線追踪單元,增加了大量FP64雙精度計算單元,專為AI任務進行了硬件定制。


CUDA計算單元和性能優化

每張H100 GPU擁有18432個CUDA計算單元,旨在實現更高效的異步執行和任務並行處理。其設計優化確保能夠處理各種異構計算任務,提高計算效率和吞吐量。


PCIE與SXM接口選擇

H100提供兩種接口版本:PCIE和SXM。SXM版本能夠提供更高的互聯帶寬,適合需要多卡並聯工作的數據中心和超算應用。PCIE版本雖然便於普及,但在多卡聯合時需要額外的NVLink橋接卡來提升帶寬和效率。


性能和能效的巨大提升

H100在AI訓練和推理任務上表現出色,相較於前代A100,其訓練性能提升了3.3倍,推理性能提升了4.5倍,而價格僅略高於A100。此外,H100在相同電費下能夠實現更高的計算性能,使得其在全球超算排行榜中占據重要位置。



分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.