大家早安,今天我們來追蹤 XPU 的最新進展。這個詞彙從最初 Intel 的戰略口號,逐漸成為半導體產業的共通語言。背後連結了異質運算的核心思想、先進封裝的技術突破,以及標準組織對新型處理器的定義。
異質運算:XPU 的精神核心
異質運算的意義,在於不同種類的處理器協同工作,各自處理最適合的任務。CPU 負責控制與邏輯,GPU 強於矩陣與並行運算,NPU 在手機中處理低功耗推論,DPU 則分擔資料搬移與安全。當這些單元能在同一個系統中被靈活調度,整體效能與能效比便能最大化。

Intel Foveros 技術示意,展現異質晶片在單一封裝中的組合。
(延伸閱讀:AI 晶片:CPU、GPU、NPU、TPU、3D 封裝是堆出一個生態系:TSMC SoIC vs Intel Foveros)
3.5D 封裝:XPU 的硬體落地
要讓異質運算落地,先進封裝是關鍵。2.5D 代表晶片放在同一個矽中介層上,3D 則是利用 TSV 技術堆疊晶片。3.5D 的說法,則源自工程師文化中的幽默:它比 2.5D 更緊密,又不像 3D 那樣完全垂直堆疊,是一種介於兩者之間的混合方案。

Broadcom 釋出的 AI 晶片封裝示意,展現 3.5D 技術能將 GPU 與 HBM 整合。
Broadcom 最新的 AI XPU 採用 3.5D 設計,能同時支援 6000 平方毫米以上的大面積矽片,以及多達 12 顆 HBM 疊堆。Intel 的 EMIB + Foveros,和台積電的 CoWoS-L / InFO-LSI,也都屬於類似的 3.5D 解法。
(延伸閱讀:CoWoS 是什麼?這個封裝技術讓 NVIDIA 算力翻倍、RAM、DRAM、Flash 與 HBM:記憶體的發展地圖)
Broadcom 的三把刀
Broadcom 是近期把 XPU 概念推向頭條的公司。他們靠三個方向發力:
- 客製 XPU。市場盛傳他們拿下未具名的超大客戶訂單(外界普遍指向 OpenAI),金額約 100 億美元,涵蓋整櫃 AI 系統。這說明雲端巨頭已經開始用客製 XPU 來降低能耗與成本。
- 3.5D 封裝。Broadcom 公布的 XDSiP 平台能把巨型 GPU/AI 晶粒與多顆 HBM 拉進一個封裝,正面迎擊 Nvidia 在大模型訓練的頻寬優勢。
- AI 網路。當集群規模突破十萬節點,真正的瓶頸變成如何讓多顆 XPU 共用記憶體。Broadcom 正以新一代以太交換 ASIC 把 AI 網路語意化,挑戰 Nvidia 的 Spectrum-X。
SNIA 標準推手

2025 年於美國聖塔克拉拉舉辦的 SNIA 開發者大會(SDC 2025)。會議主題涵蓋晶片小晶粒(chiplets)、UCIe 互連、持續性記憶體,以及異質整合,並以「未來處理器晶片」為核心。這顯示 SNIA 這個主要制定儲存與資料中心標準的國際組織,也開始把 XPU 與異質運算納入標準討論的範疇。
另一個關鍵角色是 SNIA(Storage Networking Industry Association)。這個成立於 1997 年的國際協會,長期專注於資料中心與儲存標準。近年提出的 xPU Initiative,嘗試把 CPU、GPU、DPU、IPU 等統整為「卸載特定工作的處理單元」,並建立共通框架。這使得 XPU 不再只是行銷口號,而有了產業標準與互通性基礎。
總結來看,XPU 已經進入從名詞走向訂單的階段。Intel 把它作為 IDM 2.0 的旗幟,Nvidia 依靠 CUDA 生態實現落地,而 Broadcom 則透過 3.5D 封裝與 AI 網路直接拿下巨額訂單。異質運算是它的思想核心,3.5D 是它的物理基礎,而 SNIA 則為它補上制度化的框架。