
在 AI 晶片的世界裡,名字看起來只差幾個字母,但背後的設計哲學與製程工藝卻天差地遠。CPU 是最早的跑者,通用性最強,卻逐漸被視為萬能但不專精的坦克。當影像遊戲崛起,GPU 登場,它像卡車一樣能一次搬運成千上萬個像素,成為影像處理與深度學習訓練的主力。
隨著雲端 AI 模型規模暴漲,Google 推出了 TPU,用專用的矩陣引擎來承擔張量運算。最後,在行動與邊緣裝置需求推動下,NPU 登場,它不是取代 GPU,而是專注在低功耗推論的場景,像小客車般靈活,讓 AI 能深入到手機、相機、家電與汽車。這四種處理器,不只是名字不同,更在 架構設計 與 製程工藝 上展現出截然不同的 DNA。
CPU:坦克式的通用大腦
CPU(中央處理器)的使命是什麼都能做。它核心數量少(2–64 個常見),但每顆核心複雜度極高,擁有分支預測、快取階層、複雜指令集,適合邏輯控制與作業系統。- 架構特徵:
- 少數強核心 + 大量 SRAM(靜態隨機存取記憶體)快取
- 高頻設計,注重單核效能與通用性
- 指令集複雜(x86 / ARM)
- 製程特徵:
- 最先進節點優先採用(3nm / 2nm)
- 曝光挑戰:mask 層數最多(>100 層),臨界尺寸控制最嚴苛
- 設計複雜,對 EUV 的 overlay 與 CD 均勻性極度依賴
- 核心數的影響:
- 更多核心 → 更好的多工處理
- 但單程式效能仍取決於單核強度
- 像是辦公室裡多幾個超強經理人,可以同時管不同專案,但專案內部效率還是靠單一經理人
(延伸閱讀:CPU 是怎麼做出來的?)
GPU:卡車式的平行加速
GPU(圖形處理器)原本為遊戲影像設計,它的核心設計是數千個簡單運算單元組成的平行架構,適合對龐大的矩陣同時操作。這讓 GPU 意外成為 AI 訓練的最佳硬體。
- 架構特徵:
- 上千個簡單核心,SIMD / SIMT 指令集
- 浮點運算與矩陣計算能力極強
- SRAM 比例低於 CPU,更依賴外部記憶體
- 製程特徵:
- 晶片面積巨大(600–800mm² 甚至上千)
- 曝光挑戰:大晶片需要多重曝光拼接(stitching),良率壓力極大
- 追求面積效率與散熱控制,通常落在 5nm / 4nm
- 核心數的影響:
- 更多核心代表更高 FLOPS(浮點運算能力)
- 適合矩陣平行化任務(影像渲染、深度學習訓練)
- 但若運算無法平行化,再多核心也閒置
- 像裝配線,多幾百工人一起鎖螺絲,產能倍增,但若工作需要討論決策,工人就派不上用場
TPU:高鐵式的專用張量引擎
TPU(Tensor Processing Unit)是 Google 專為 TensorFlow 設計的 ASIC。它的核心是一個規律排列的矩陣乘法陣列(MAC systolic array),專注於深度學習中的張量運算。
- 架構特徵:
- 大規模矩陣乘法陣列 + SRAM 快取
- 指令集極簡,僅支援 AI 必要運算(矩陣、卷積、激活函數)
- 完全針對 TensorFlow 生態優化
- 製程特徵:
- 不一定採最先進節點(TPU v2/v3 曾用 28nm / 16nm)
- 曝光挑戰:陣列規律,OPC 校正簡單,但 SRAM block 需要高 CD 均勻性
- 以效能 / 能效為主,不追求最高頻率
- 核心數的影響:
- 這裡的核心不是 CPU 式的 core,而是 MAC 單元陣列
- 陣列越大,單次矩陣吞吐率越高
- 像製麵機,滾輪越寬,每次壓出的麵條就越多
(延伸閱讀:Google TPU 的垂直整合)
NPU:小客車式的邊緣推論引擎
NPU(Neural Processing Unit)是 AI 時代的新星,專為推論設計,重點是能效與低延遲。它不像 GPU 那樣追求極致算力,而是針對日常 AI 任務(臉部辨識、即時翻譯、影像增強)做優化。
- 架構特徵:
- 小型 MAC 陣列,常搭配 DSP 與 SRAM 緩衝
- 支援 INT8 / INT4 量化,犧牲精度換取能效
- 可積木式擴展:小至手機晶片,大至邊緣伺服器
- 製程特徵:
- 常見於行動 SoC,採 6nm / 5nm 低功耗製程
- 曝光挑戰:對 leakage(漏電) 與變異控制敏感
- 對能效比(TOPS/W)優化遠比極限算力更重要
核心數的影響:
- 核心數增加代表更快的臉部辨識、更省電的推論
- 在邊緣伺服器可堆疊成多顆 NPU 模組
- 像小客車車隊,多幾台能同時載更多人,但每台都省油
核心數不是唯一答案
CPU 需要少數強核心來支撐系統邏輯;GPU 則依賴上千核心達到平行吞吐;TPU 的核心其實是矩陣單元,陣列大小決定訓練速度;NPU 則在能效與規模化之間找平衡。
所以核心數並非單純的數字遊戲,而是背後架構與製程的設計取捨。真正決定差異的,是它們各自要解的題:多工?平行?專用?還是低功耗推論?
新的時代,一定會有新的王者。但更可能的真相是這四種晶片會持續共存,在不同舞台上扮演最佳角色。