CPU重要性回歸:進入Agentic AI世代如何推升對高核心 CPU 的需求

更新 發佈閱讀 8 分鐘

解析 AWS re:Invent 2025 與新一代 AI 基礎設施的演進邏輯—

在過去幾年的生成式 AI 浪潮中,市場焦點主要集中於模型訓練與標記(Token)生成的速率,這使得擅長平行運算的 GPU 成為絕對的主角。然而,本周(2025/12/01~05)即將結束的AWS re:Invent 2025中,AWS強調 Agentic AI(代理式 AI)時代開啟,一口氣丟出超過30 項與生成式AI、代理式AI 相關的新服務與更新,可以觀察到 AI 的應用型態發生了本質上的變化,逐漸被大眾遺忘的CPU重要性似乎已逐步回歸

AWS re:Invent 2025 為全球最大雲端技術盛會,今年12 月初在拉斯維加斯登場。 議程聚焦Agentic AI、量子安全與開發者創新,為技術專家提供前瞻洞察與實踐路徑,共同形塑雲端運算的未來版圖。 每年大約在這個時節,全球雲端運算社群都會在拉斯維加斯經歷一場技術朝聖之旅。
CPU重要性回歸:進入Agentic AI世代推升對高核心 CPU 的需求

CPU重要性回歸:進入Agentic AI世代推升對高核心 CPU 的需求


AI系統「管理與調度」的效率推升CPU重要性

—Agentic AI 的核心特徵在於「行動」與「互動」,而非僅止於「生成」。—

如果將傳統的生成式 AI 比喻為一位專注於創作的數位藝術家(GPU),那麼 Agentic AI 則更像是一個需要協調多方資源的專案經理(CPU)

  • 藝術家(GPU)負責繪製圖像或撰寫文案(高強度矩陣運算)。
  • 專案經理(CPU)負責理解客戶需求、拆解任務、查詢資料庫、調用外部工具(API),並確保最終交付成果符合邏輯與規範。

在這個協作體系中,雖然「創作」本身至關重要,但「管理與調度」的效率往往決定了整個系統的反應速度與穩定性。


技術解析:為何 Agent 需要更強的 CPU?

根據最新的學術研究與效能分析,Agentic Workflow(代理工作流)的引入,顯著改變了伺服器的負載特徵。

工具處理(Tool Processing)的延遲佔比

近期一篇名為《A CPU-Centric Perspective on Agentic AI》的研究指出,在某些複雜的 Agent 應用場景中,CPU 負責的工具處理階段可能佔據端到端延遲的相當比例,在極端測試案例中影響甚至可高達 90%。

這是因為 Agent 在執行任務時,並非總是處於「推論」狀態,而是頻繁地進行以下操作:

  • 字串處理與格式化: 將用戶模糊的指令轉換為模型可理解的結構化 Prompt。
  • 序列化與反序列化(Serialization): 處理工具(Tools)回傳的 JSON 或 XML 格式資料,這類資料解析是典型的 CPU 密集型任務。
  • 邏輯判斷與分支: 根據上一步的結果決定下一步行動(例如:若搜尋結果為空,則改換關鍵字重新搜尋)。

Python 執行環境與並發挑戰

目前主流的 AI Agent 開發框架多基於 Python 生態系,但Python 的全域直譯器鎖(英語:Global Interpreter Lock,縮寫GIL)特性可能會限制多核心的效率。

為了維持高吞吐量,企業級的 Agent 系統會需要採用多進程(Multi-processing)架構,這將直接增加了對 CPU 核心數的需求。

檢索增強生成(RAG)的運算瓶頸

Agentic AI 依賴 RAG 技術來獲取最新資訊。在這個過程中:

  • 向量檢索: 雖然部分可由 GPU 加速,但在大規模資料庫中,基於 CPU 的索引遍歷仍是主流且具成本效益的選擇。
  • 文檔重排序: 為了精準度,系統通常會先檢索大量文檔,再由 CPU 進行初步過濾與邏輯排序,以減輕昂貴 GPU 的負擔。

產業觀察:基礎設施的調整

科技巨頭在硬體佈局上的最新動態,也反映了這種「算力平衡」的趨勢;近期AWS 與 NVIDIA 等廠商並非單方面堆疊 GPU,而是開始強調 CPU 與 GPU 的協同效應

AWS re:Invent 2025 與 Graviton5

Amazon Web Services 在其年度大會上重點展示了 Graviton5 處理器。這款晶片擁有高達 192 個核心,並採用單插槽(Single-socket)設計以降低 NUMA(非統一記憶體存取)延遲。

這顯示出雲端服務商已預見到,未來的推論節點需要一顆強大的「大腦」來餵養 GPU。若 CPU 處理數據前置作業(Pre-processing)的速度跟不上 GPU 的推論速度,將導致昂貴的 GPU 資源閒置,這是企業極力避免的成本浪費。

NVIDIA 的架構思維:Grace CPU

而NVIDIA 也在 GB200 架構中整合了 Grace CPU。

  • 統一記憶體(Unified Memory): 透過高速互連技術,CPU 與 GPU 可以共享記憶體空間。這對於 Agent 處理長文本或大型資料庫時極為關鍵,因為 CPU 可以快速存取 GPU 運算所需的上下文,減少資料搬運的延遲。
  • 卸載管理: 將 KV Cache 管理等非矩陣運算任務卸載給 CPU,能釋放更多 GPU 記憶體用於核心生成任務。

實務案例:差旅規劃 Agent

為了具體說明,我們可以拆解一個「差旅規劃 Agent」的執行流程,觀察 CPU 在其中的介入點:

拆解差旅規劃 Agent執行流程

拆解差旅規劃 Agent執行流程

在此案例中,步驟 3、4、5 雖然不涉及深度的神經網絡運算,但卻是影響用戶等待時間(Latency)的關鍵環節;若 CPU 效能不足,即便生成速度再快,用戶仍會感覺系統反應遲鈍。


CPU為AI系統協調中樞

Agentic AI 的興起,標誌著 AI 應用從「單點突破」走向「系統整合」:在這個階段,CPU 已不再是只是配角,而是成為系統的協調中樞。

後續我們可以關注以下趨勢:

  1. 基礎設施配置的再平衡: 在採購 AI 伺服器時,除了關注 GPU 規格,應重新評估 CPU 的核心數與記憶體頻寬,以避免「小馬拉大車」造成的瓶頸。
  2. 關注推論成本優化: 對於邏輯判斷多於內容生成的任務,適度將工作負載轉移至現代化的高效能 CPU,可能是比全 GPU 架構更具成本效益的選擇。
  3. 軟體架構的優化: 開發 Agent 時,重視非同步處理(Async I/O)與資料序列化的效率,往往是提升效能重要事項。

總而言之,隨著 AI 發展變得更具「代理」性質時,接下來我們將見證一個GPU與CPU更加緊密協作的時代。


透過NotebookLM影片摘要功能了解本篇文章



延伸閱讀

Frontier agents, Trainium chips, and Amazon Nova: key announcements from AWS re:Invent 2025,20251204,AWS官網新聞。

AWS Graviton5 Strikes A Different Balance For Server CPUs,20251204,THE NEXT PLATFORM,Timothy Prickett Morgan。

AWS AI 版圖大爆發!拆解新自研晶片、可客製化 LLM、AI 工廠的背後野心,20251203,科技報橘,廖紹伶。

A CPU-Centric Perspective on Agentic AI,202511,Ritik Raj†、Hong Wang 、Tushar Krishna。



留言
avatar-img
維那思的異想世界
26會員
142內容數
這裡分享維那思的日常與異想
2025/12/02
你的個資值多少錢?黑五AI狂賣118億美元,韓國爆發3300萬人資料外洩國難!當購物便利變成資安核彈,你還敢「一鍵下單」嗎?揭開AI電商雙面刃真相,立即學會4招數位自保術! 💸 AI 點燃黑五:美國零售網站 AI 流量暴增 805% 🤖 酷澎 3,370 萬筆資料外洩:南韓爆發重大資安事件
Thumbnail
2025/12/02
你的個資值多少錢?黑五AI狂賣118億美元,韓國爆發3300萬人資料外洩國難!當購物便利變成資安核彈,你還敢「一鍵下單」嗎?揭開AI電商雙面刃真相,立即學會4招數位自保術! 💸 AI 點燃黑五:美國零售網站 AI 流量暴增 805% 🤖 酷澎 3,370 萬筆資料外洩:南韓爆發重大資安事件
Thumbnail
2025/11/25
AI運算成本(如Sora每日1,500萬美元 )壓力無比巨大,迫使Google、OpenAI等科技巨頭走向廣告變現。Google於2025年11月測試在AI搜索中試著植入「無縫」廣告 ,此舉犧牲了用戶對資訊客觀性的信任,可能標誌著免費智慧時代即將終結。
Thumbnail
2025/11/25
AI運算成本(如Sora每日1,500萬美元 )壓力無比巨大,迫使Google、OpenAI等科技巨頭走向廣告變現。Google於2025年11月測試在AI搜索中試著植入「無縫」廣告 ,此舉犧牲了用戶對資訊客觀性的信任,可能標誌著免費智慧時代即將終結。
Thumbnail
2025/11/24
Starship Technologies 與 Uber Eats 共同宣布建立全球合作夥伴關係,並將自主送貨機器人服務首次引入歐洲市場,預計12 月正式投入運營。 最後一哩路是物流成本最高的環節:透過 AI 自主配送機器人,外送平台正將高變動的人力成本轉化為可規模化的固定資產,同時解決勞動力問題。
Thumbnail
2025/11/24
Starship Technologies 與 Uber Eats 共同宣布建立全球合作夥伴關係,並將自主送貨機器人服務首次引入歐洲市場,預計12 月正式投入運營。 最後一哩路是物流成本最高的環節:透過 AI 自主配送機器人,外送平台正將高變動的人力成本轉化為可規模化的固定資產,同時解決勞動力問題。
Thumbnail
看更多
你可能也想看
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
🚀 Nvidia 投資 Intel 50 億美金,開啟 CPU + GPU 整合新時代!本文將帶你了解這場矽片婚姻背後的動機、AI 運算的最大瓶頸、未來 x86 + RTX SOC 的潛力,以及這對黃綠聯盟將如何撼動資料中心與 AI PC 市場。💻⚡
Thumbnail
🚀 Nvidia 投資 Intel 50 億美金,開啟 CPU + GPU 整合新時代!本文將帶你了解這場矽片婚姻背後的動機、AI 運算的最大瓶頸、未來 x86 + RTX SOC 的潛力,以及這對黃綠聯盟將如何撼動資料中心與 AI PC 市場。💻⚡
Thumbnail
CPU、GPU、TPU、NPU名字相似,架構與用途大不同
Thumbnail
CPU、GPU、TPU、NPU名字相似,架構與用途大不同
Thumbnail
對我們許多人來說,「遊戲」早已不只是閒暇時的消遣,它是一個可以讓我們化身英雄、探索奇幻大陸、與戰友們並肩作戰的沉浸式宇宙。然而,要能順暢地進入這些令人神往的世界,你需要一把鑰匙,一個能將虛擬化為現實的強大傳送門——那就是「電競筆電」。 它不僅僅是一台電腦,它更像一座能隨身攜帶的「行動戰情室」。
Thumbnail
對我們許多人來說,「遊戲」早已不只是閒暇時的消遣,它是一個可以讓我們化身英雄、探索奇幻大陸、與戰友們並肩作戰的沉浸式宇宙。然而,要能順暢地進入這些令人神往的世界,你需要一把鑰匙,一個能將虛擬化為現實的強大傳送門——那就是「電競筆電」。 它不僅僅是一台電腦,它更像一座能隨身攜帶的「行動戰情室」。
Thumbnail
科技媒體「toms hardware」報導,馬來西亞已成為台灣運算系統與電腦零件(如 CPU 與 GPU)的主要進口國,特別美國對先進 GPU 實施出口限制之後。數據顯示,2025 年 3 月,台灣對馬來西亞的電腦系統出口額達 18.74 億美元,去年同期出口額僅為 4.02 億美元,年增 366%
Thumbnail
科技媒體「toms hardware」報導,馬來西亞已成為台灣運算系統與電腦零件(如 CPU 與 GPU)的主要進口國,特別美國對先進 GPU 實施出口限制之後。數據顯示,2025 年 3 月,台灣對馬來西亞的電腦系統出口額達 18.74 億美元,去年同期出口額僅為 4.02 億美元,年增 366%
Thumbnail
雷達的原理也類似這個CPU跟GPU。 傳統都卜勒雷達就是CPU,有強大性能一次掃一個地方,所以雷達要不斷旋轉,掃到一遍,處理一個地方。是雷達技術的起始,現在看來省電、體積小、便宜。 陣列雷達則是GPU,有一堆小雷達聚合在一個雷達陣列上,專門掃描各自的區塊,然後整合成方位跟高度的資訊,完成掃描(作
Thumbnail
雷達的原理也類似這個CPU跟GPU。 傳統都卜勒雷達就是CPU,有強大性能一次掃一個地方,所以雷達要不斷旋轉,掃到一遍,處理一個地方。是雷達技術的起始,現在看來省電、體積小、便宜。 陣列雷達則是GPU,有一堆小雷達聚合在一個雷達陣列上,專門掃描各自的區塊,然後整合成方位跟高度的資訊,完成掃描(作
Thumbnail
當我們在使用電腦、玩遊戲或訓練 AI 模型時,CPU 和 GPU 這兩個名詞經常出現。它們是電腦中的兩大處理核心,雖然名字相似,但功能和特點截然不同。為了讓大家更好地理解,我們可以把它們分別比喻為「定性分析專家」和「定量分析高手」。 CPU:大腦中的定性分析專家 CPU,全名為「中央處理器」(C
Thumbnail
當我們在使用電腦、玩遊戲或訓練 AI 模型時,CPU 和 GPU 這兩個名詞經常出現。它們是電腦中的兩大處理核心,雖然名字相似,但功能和特點截然不同。為了讓大家更好地理解,我們可以把它們分別比喻為「定性分析專家」和「定量分析高手」。 CPU:大腦中的定性分析專家 CPU,全名為「中央處理器」(C
Thumbnail
OpenCV 提供了專門針對 CUDA 優化的模組,這些模組使用 cv2.cuda 命名空間,並且可以直接使用 GPU 進行加速。,cv2.cuda 模塊需要在 OpenCV 編譯時啟用 CUDA 支援才能使用。 本文主要比較經過CMAKE重新編譯OpenCV使其支援Cuda,原OpenCV只支援
Thumbnail
OpenCV 提供了專門針對 CUDA 優化的模組,這些模組使用 cv2.cuda 命名空間,並且可以直接使用 GPU 進行加速。,cv2.cuda 模塊需要在 OpenCV 編譯時啟用 CUDA 支援才能使用。 本文主要比較經過CMAKE重新編譯OpenCV使其支援Cuda,原OpenCV只支援
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News