今天我們來談談 CPO(Co-Packaged Optics,共封裝光學)。二十年前,半導體產業透過摩爾定律讓運算力一路狂飆。從九零年代末的 Intel CPU,到今天的 Nvidia B200 GPU,浮點運算能力已經放大十幾萬倍。然而,這些效能並沒有被完全發揮,因為我們撞上了一堵又一堵牆。過去我們常說的記憶體牆,如今又多了一道全新的瓶頸:I/O 頻寬牆。CPO 正是被推到舞台中央的解法。
當 GPU 在訓練 AI 模型時,數據必須以極高的速率在伺服器與伺服器之間傳遞。銅線能處理幾公分到兩公尺的傳輸,但更長距離就會因損耗與功耗失衡而無法負荷。這時光纖接手,卻因為轉換必須經過獨立的可插拔光模組,導致速度與能效都被拖累。這種「矽能跑,光卻卡」的落差,讓 CPO 顯得迫切。
什麼是 CPO?
CPO 的核心就是把光學引擎拉近晶片傳統是交換晶片出電訊號,經過 SerDes(Serializer/Deserializer,串行化/反串行化電路) 把多條平行電訊號整理成高速的串行訊號,再送到板卡前端的光模組轉換成光。
有了 CPO,SerDes 並不會消失,但它的負擔會大幅減輕。因為光引擎就放在晶片封裝旁,訊號不需要長距離銅線傳輸,衰減變少,SerDes 不必超頻運作或做大量補償。這意味著 CPO 是減少 SerDes 的能耗與複雜度,而不是替代它。
挑戰與解法
但把光學元件搬進封裝不是簡單的事。第一個問題是散熱。光子電路的波導對熱非常敏感,稍有偏移就可能與雷射波長錯開而失效。第二個問題是耦合。光纖核心直徑約 10 微米,而晶片內的波導只有幾百奈米,要把消防水管對準吸管並不容易。再來是生態系的慣性。可插拔模組便宜、成熟、可替換,要說服客戶捨棄它,需要一個足夠強大的理由。
這就是為什麼我們看到中繼解法。例如 On-Board Optics(OBO)把光引擎放在電路板上,Near-Package Optics(NPO)則透過中介層拉近距離。它們就像 2.5D 是 3D 的過渡方案,逐步把產業推向共封裝光學。
從概念到實踐
雖然學界早在 2000 年代初期就有人討論光子電路靠近邏輯 IC的可行性,但真正被產業正式提出,始於 2018 年 Microsoft 領導的 OBO 聯盟。這是第一個嘗試用標準化方式把光學模組移近伺服器板卡。
接著在 2019–2020 年,市場開始出現 Near-Package Optics 的方案,「Co-Packaged Optics」這個名稱才被廣泛使用。第一個真正落地的產品是 Broadcom 的 Tomahawk 5 交換晶片,在 2020 年達到 51.2 Tbps,並內建 CPO,成為業界公認的先行者。
2021 年,TSMC 推出 COUPE(Compact Universal Photonics Engine)平台,把電性 IC 疊在光子 IC 上,透過 3D 封裝提升速度並降低功耗。雖然一開始反應冷淡,但在 2023–2025 年生成式 AI 浪潮帶動下,TSMC 與 Nvidia 結盟推出支援 CPO 的交換平台,讓技術正式走出實驗室。
同時,GlobalFoundries (GF,美國總部的晶圓代工廠)長期經營的 Fotonix 平台與新創 Ayar Labs、Ranovus、Lightmatter 形成了另一股勢力。他們更早推出光學 chiplet產品,甚至獲得 AMD 與 Intel 投資,展現另一種路線。
簡而言之,Broadcom 商用最早,TSMC 建立封裝生態,GF 和新創在矽光子技術上領先,Nvidia 則因 AI 浪潮把 CPO 變成必備。
馮紐曼瓶頸 vs. CPO 頻寬牆
如果回顧我們在 EP82 討論過的「馮紐曼瓶頸」,會更容易理解 CPO 的定位。
- 馮紐曼瓶頸:處理器與記憶體之間的通道受限,CPU/GPU 算力再快,也常常在等 DRAM 傳資料。這是 晶片內部架構層級的問題。就像一個人腦袋很快,但眼睛閱讀太慢,大腦只能乾等。
- CPO 頻寬牆:伺服器與伺服器之間的資料通道不足。當數千張 GPU 要同時交換訓練資料時,銅線與傳統光模組成為障礙。這是 資料中心網路層級的問題。就像不同房間的腦袋要開會,卻因走廊太窄或電話線太慢而卡住。
兩者疊加起來,構成了算力發揮的雙重障礙。這也解釋了為什麼 HBM、Cache、In-Memory Computing 這些技術會和 CPO 一起被提及:前者解決的是內部瓶頸,後者解決的是外部瓶頸。
(延伸閱讀:記憶體與馮紐曼瓶頸:從 DRAM 到 HBM 的演進)
能耗壓力與市場拐點
CPO 之所以在 2023 後加速,背後是 AI 工廠的能耗壓力。資料中心的電力預算有限,若 SerDes 與網路傳輸吃掉過多功率,就等於 GPU 算力被白白浪費。這使得從「nice to have」變成「must have」。

Nvidia 在 GTC 發表的新平台,把 CPO 帶入實戰。
因此,Nvidia 在 2025 年 GTC(GPU Technology Conference,Nvidia 每年舉辦的旗艦活動)宣布的 Quantum-X 與 Spectrum-X 平台,分別代表兩條線:Quantum-X 是基於 InfiniBand 的高效能交換平台,專為 AI 超算與低延遲工作負載設計;Spectrum-X 則是基於 Ethernet 的 AI 資料中心網路,強調規模化部署的效率與彈性。這兩者首次整合 CPO,並宣稱能提升 3.5 倍能效與 10 倍韌性,標誌著 CPO 從實驗走向實戰。
CPO 的推廣仍面臨現實考量。首先,標準尚未統一,供應鏈分工仍混亂。其次,光子與電性元件的溫控問題,若解不開,將限制規模擴張。最後,對於全光子晶片的幻想雖然存在,但缺乏穩定的片上光源與邏輯設計基礎,仍停留在遠景。
它不是一夕翻轉,而是透過封裝這條路徑,逐漸重構雲端的能源與效能地圖。