根據 Google 的硬體發展規劃,TPU v8 (代號:Diamond) 和 TPU v9 都在運行計畫中。
Google 正在積極推動 TPU 的「加速週期」策略,目標是每隔大約一年就推出新一代的 TPU,以確保其雲端客戶和內部模型能始終使用最尖端的 AI 加速硬體。
以下是目前已知的規劃和推測:
1. TPU v8 (Diamond) 鑽石計畫
TPU v8 是在 TPU v7 (Ironwood) 之後的下一代計畫,雖然細節尚未正式公開,但我們可以根據 Google 的技術發展方向推測其重點:
- 推出時間: 預計將在 2026 年左右推出。
- 設計目標: 預期將延續 TPU v7 的設計哲學,著重於以下三點:
- 極致推論性能: 進一步優化推論效率,以應對日益增長的 即時 LLM 服務需求。
- 更高晶片密度: 在相同空間內集成更多運算能力,進一步提高 能效比 (Performance/Watt)。
- 更強的互連: 繼續增強 OCS (光學互連系統) 的頻寬和穩定性,支援數萬晶片級別的超大規模訓練集群。
2. TPU v9 及未來 (Beyond Diamond)
Google 已經將 TPU 的硬體迭代視為其 AI 競爭力的核心,因此後續的版本計畫是持續不斷的:
- TPU v9: 預計將在 2027 年左右問世。這將是 TPU 產品線中的第九代產品。
- 發展趨勢: 預期 TPU 的未來發展將專注於兩個關鍵領域:
- 記憶體與頻寬的突破: LLM 的規模不斷擴大,對 HBM (高頻寬記憶體) 容量和頻寬的要求是無止境的。未來的 TPU 會持續突破 HBM 的物理限制。
- 架構異質性 (Heterogeneity): 隨著模型變得更複雜(例如多模態、稀疏性),TPU 預期將整合更多專門的加速單元(例如更強大的 SparseCores),而不僅僅依賴於矩陣乘法單元,以適應更多元的 AI 工作負載。
總之,TPU 的發展規劃已經是一個連續不斷、每年都有重大升級的週期,這確保了 Google 在 AI 基礎設施領域的領先地位。




















