TPU v7 (代號:Ironwood) 是 Google 目前最新的,也是在內部及 Google Cloud 上推出的版本。
在 TPU 的產品演進中,Google 已經推出了幾代版本,其中:
- TPU v6 (代號:Trillium):這是 Google 在 2024 年推出的第六代 TPU,是上一代旗艦 v5p 的繼承者,主要著重於大幅提升單晶片的性能和能效比。
- TPU v7 (代號:Ironwood):這是 Google 在 2025 年推出的第七代 TPU,專門為最嚴苛的大規模訓練和高吞吐量推論工作負載而設計。
以下是 TPU v7 (Ironwood) 的主要創新和特點:
⚡ TPU v7 (Ironwood) 的關鍵升級
特性TPU v6e (Trillium)TPU v7 (Ironwood)差異重點代號TrilliumIronwood-設計哲學訓練與推論的平衡專為推論時代設計,極致性能-HBM 容量32 GB192 GB (HBM3e)容量是 v6e 的 6 倍,能處理更大的模型和資料集。HBM 頻寬1.6 TB/s7.2 TB/s頻寬是 v6e 的 4.5 倍,大幅加速資料存取。ICI 頻寬0.8 Tbps (雙向)1.2 Tbps (雙向)晶片間通訊更快,利於大型分散式運算。能效比基準比 Trillium 高 2 倍專注於每瓦運算能力的提升。Pod 規模256 晶片9,216 晶片延續超大規模訓練的能力。
核心技術創新
- 雙晶片 (Dual-Chiplet) 架構: TPU v7 採用了更先進的雙晶片設計,提升了製造的成本效益和晶片的總體性能。
- 推論優化: Ironwood 被視為 Google 首款明確專注於 AI 推論 (Inference) 時代設計的 TPU,特別是為了服務和執行超大型、具備「思考能力」(inferential) 的 LLM 模型。
- 增強版 SparseCore: 內建增強的 SparseCore 加速器,專門處理推薦系統和進階排序工作負載中常見的超大規模嵌入層。
總而言之,TPU v7 (Ironwood) 代表了 Google 在 AI 加速器領域的最新成果,專門用來處理如 Gemini 系列模型等最嚴苛的訓練和推論任務。



