vocus logo

方格子 vocus

TPU v5 系列:剖析 v5e 與 v5p 的差異,為 AI 訓練與推論打造最佳化解決方案

更新 發佈閱讀 4 分鐘

TPU v5 系列最大的創新在於產品線的分化,將晶片明確劃分為兩個版本,以滿足訓練與推論(Inference)市場中對極致效能成本效益的不同需求。

TPU v5 系列的核心是 v5ev5p,兩者基於相似的架構,但在性能、互連和 HBM 記憶體等方面有顯著差異。


1. 產品線分化:v5e (經濟) 與 v5p (效能) 🎯

特性Cloud TPU v5e (經濟/推理優化)Cloud TPU v5p (極致效能/訓練優化)設計目標成本效益最高、中大型訓練、推論 (Inference)極致效能、大規模基礎模型訓練 (LLMs)單晶片性能197 TFLOPS (bfloat16)~460 TFLOPS (bfloat16)HBM 容量16 GiB32 GiBPod 規模最大 256 晶片 (2D 環面)最大 8,960 晶片 (3D 環面)互連頻寬1600 Gbps/晶片4800 Gbps/晶片 (極高)定價價格比 v4 低於一半,性價比極高。價格較高,但訓練速度比 v4 快 2.8 倍。


2. v5e (v5-Economy):平民化 AI 訓練與推論

TPU v5e 是 Google 首次專門針對成本敏感型推論工作負載進行設計的版本。

  • 推論優化: v5e 支援高效能的 INT8 運算,這對 LLM(大型語言模型)的推論和服務至關重要。它在推論上的每美元性能比 v4 提升高達 2.5 倍。
  • 靈活的配置: v5e 支援從 1 個晶片到 256 個晶片的各種配置,靈活性更高,讓使用者能精確地匹配其工作負載規模,降低入門門檻。
  • 價格優勢: 旨在讓更多企業和團隊能夠以更低的成本運行中大型 AI 模型。

3. v5p (v5-Performance):極致規模與速度

TPU v5p 是針對要求最高性能的超大規模訓練所設計,接替 v4 成為 Google 的訓練旗艦晶片。

  • 性能躍升: 相比 TPU v4,v5p 的單晶片 FLOPS (浮點運算) 提升超過 2 倍,並擁有 3 倍的 HBM 記憶體頻寬。在 LLM 訓練上,速度提升約 2.8 倍。
  • 最大規模互連: v5p 將 TPU Pod 的最大規模從 v4 的 4096 晶片擴大到 8,960 晶片,並維持 v4 的 3D 環面拓撲,但將每個晶片的互連頻寬大幅提高至 4,800 Gbps。這保證了在近萬個晶片組成的集群中,數據傳輸和同步仍能保持極高效率。
  • 第二代 SparseCores: 繼承並升級了 v4 中引入的 SparseCore,對依賴大量嵌入層 (Embeddings) 的模型(如推薦系統)訓練速度比 v4 快 1.9 倍。

4. 總結創新:分工與效率

TPU v5 系列的核心創新是:

  1. 分工明確: 首次將晶片分為 v5p (性能/訓練) 和 v5e (成本/推論),允許客戶針對特定需求進行最佳化。
  2. 規模提升: v5p 將訓練 Pod 的規模推向新的高峰(8,960 晶片),鞏固 Google 在超大規模 AI 訓練基礎設施上的領先地位。

展望未來 (Trillium / v6)

Google 在 v5 之後已發布了下一代 TPU Trillium (或稱 v6)。 Trillium 在能源效率和單晶片性能上再次大幅躍升,宣稱性能比 v5e 提高 4.7 倍,將繼續沿著「極致效能」和「極致能效比」的方向發展。

留言
avatar-img
sirius數字沙龍
23會員
515內容數
吃自助火鍋啦!不要客氣,想吃啥,請自行取用!
你可能也想看
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
這一兩年,AI 帶來的產業劇變速度之快,讓整個科技界猶如被按下「加速鍵」。從 PCB、散熱技術、機櫃軌道、交換器到伺服器供應鏈,短短時間內全都被 AI 推著往前走。而現在,這股巨浪正式推向了另一個過去不太起眼的主角——記憶體 其中,高頻寬記憶體(HBM)的全球缺料,更像是一把點燃產業鏈的野火;一旦
Thumbnail
這一兩年,AI 帶來的產業劇變速度之快,讓整個科技界猶如被按下「加速鍵」。從 PCB、散熱技術、機櫃軌道、交換器到伺服器供應鏈,短短時間內全都被 AI 推著往前走。而現在,這股巨浪正式推向了另一個過去不太起眼的主角——記憶體 其中,高頻寬記憶體(HBM)的全球缺料,更像是一把點燃產業鏈的野火;一旦
Thumbnail
資料來源: https://www.youtube.com/watch?v=i_nmyAeqRuE各位昨天被洗出場、今天看著大盤漲這這叫「搥心肝」的病友們,大家好!我是專治「信心不足骨質疏鬆」的骷髏醫生。💀🩺 今天台股大漲,摩爾投顧——何基鼎(GD)分析師 心情好到在節目上唱歌跳舞(真的
Thumbnail
資料來源: https://www.youtube.com/watch?v=i_nmyAeqRuE各位昨天被洗出場、今天看著大盤漲這這叫「搥心肝」的病友們,大家好!我是專治「信心不足骨質疏鬆」的骷髏醫生。💀🩺 今天台股大漲,摩爾投顧——何基鼎(GD)分析師 心情好到在節目上唱歌跳舞(真的
Thumbnail
HBM4 相較 HBM3 帶寬翻倍、效能提升,但成本高出六至七成。這場轉變讓 GPU 成本重心從算力移向記憶體,深刻改變 AI 經濟學。
Thumbnail
HBM4 相較 HBM3 帶寬翻倍、效能提升,但成本高出六至七成。這場轉變讓 GPU 成本重心從算力移向記憶體,深刻改變 AI 經濟學。
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
11/19法說會中,黃仁勳的談話展現出強烈的信心與明確方向。他表示,輝達與全球供應鏈之間的合作早已緊密串聯,從晶圓製造、先進封裝,到記憶體供應商與系統ODM工廠,所有夥伴都「很早就知道輝達的需求」,並且提前做好產能配置,確保公司在AI熱潮中擁有穩定供應。  
Thumbnail
11/19法說會中,黃仁勳的談話展現出強烈的信心與明確方向。他表示,輝達與全球供應鏈之間的合作早已緊密串聯,從晶圓製造、先進封裝,到記憶體供應商與系統ODM工廠,所有夥伴都「很早就知道輝達的需求」,並且提前做好產能配置,確保公司在AI熱潮中擁有穩定供應。  
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News