緒論:人工智能計算範式的演進與專用加速器的崛起
在現代計算科學的發展進程中,人工智能(AI)與機器學習(ML)的爆發性成長對底層硬體提出了前所未有的挑戰。傳統的中央處理器(CPU)雖然具備極高的指令集通用性,但在處理大規模矩陣運算時受限於馮·諾伊曼架構(Von Neumann architecture)的記憶體牆瓶頸;而圖形處理器(GPU)雖具備強大的並行計算能力,但其原始設計並非專門針對深度學習。在這種背景下,張量處理單元(Tensor Processing Unit, TPU)作為一種特定領域架構(Domain-Specific Architecture, DSA)應運而生,標誌著計算架構從通用化向極致專業化的跨越 。













