即時精選

Qualcomm 進軍 AI 推理晶片:從過往嘗試到「解耦推理」新賭注

Goldie 小金鷹-avatar-img
發佈於🔼半導體產業 個房間
更新 發佈閱讀 7 分鐘

前情提要:高通不是第一次做 AI 晶片

高通在資料中心 AI 推理領域其實並非新兵。過去曾推出過「Cloud AI 100 Ultra」推理卡,其規格為 870 TOPS、128 GB LPDDR4、支援 8 卡一機。

但市場反應不如預期,原因不少:市場已被 Nvidia、 AMD 等巨頭佔據,生態系統硬體+軟體配套成熟,而高通雖有硬體能力,但生態與切入點尚未突破。

這次推出的新品Qualcomm AI200 和 Qualcomm AI250,可說是高通再接再厲,並試圖「翻盤」。

撰文|編輯部|2025年10月


核心亮點:768 GB LPDDR + 「Disaggregated Inferencing」

公告內容中有兩個關鍵字值得特別留意:“768 GB LPDDR” 和 “disaggregated AI inferencing”(或稱 “disaggregated serving”)。這兩者其實比單純提升 TOPS 更為戰略性。

  • 在記憶體容量方面,AI200 每卡支援 768 GB LPDDR。 
  • 在架構策略方面,「disaggregated inferencing」意味著硬體與資源能夠在推理階段做資源拆解(Compute / Memory / Interconnect 分離),讓 Prefill(預填充)與 Decode(解碼)可以在不同伺服器架構、不同卡片或不同機櫃中協同運作。 

高通自己雖未將「disaggregated inferencing」放在宣傳標題最明顯位置,但在新聞稿及技術文章中這樣描述:

“This enables disaggregated AI inferencing for efficient utilization of hardware while meeting customer performance and cost requirements.” 

換句話說,如果你只從「NPU/TOPS」的傳統視角去看,就容易忽略高通此次產品規劃的重點:系統級拆解 + 高記憶體容量 +記憶體頻寬提升。

競爭定位:高通 vs. Nvidia 的拆解推理賽道

讓我們把焦點放在拆解推理(disaggregated inferencing)這一塊,並與 Nvidia 的產品做對照。

Prefiller 機櫃定位

  • 晶片:AI200(高通)對比 Rubin CPX(Nvidia)
  • 核心:Hexagon NPU(高通) vs. Rubin CPX GPU(Nvidia)
  • 記憶體:768 GB LPDDR(高通) vs. 128 GB GDDR7(Nvidia) 
  • Scale-Up:PCIe(高通) vs. PCIe(Nvidia)
  • Scale-Out:Ethernet(高通) vs. Ethernet/InfiniBand(Nvidia)
  • 系統:AI200 機櫃(高通) vs. CPX 機櫃/NVL144 CPX機櫃(Nvidia)
  • 上市時間:2026(高通) vs. Late 2026(Nvidia)
    評析:在這個定位上,高通的記憶體容量優勢明顯,768 GB 備受市場注目。

Decoder 機櫃定位

  • 晶片:AI250(高通) vs. Rubin 系列(Nvidia)
  • 核心:Hexagon NPU(高通) vs. Rubin GPU(Nvidia)
  • 記憶體:高通未明確公開,只提「10×記憶體頻寬」;Nvidia 則為 288 GB HBM4。 
  • Scale-Up:PCIe(高通) vs. NVLink(Nvidia)
  • Scale-Out:Ethernet(高通) vs. Ethernet/InfiniBand(Nvidia)
  • 系統:AI250 機櫃(高通) vs. VR NVL144 機櫃(Nvidia)
  • 上市時間:2027(高通) vs. Late 2026(Nvidia)
    評析:高通在 Decoder 階段時間落後一年成為潛在弱點。Nvidia 利用 NVLink+HBM 頻寬優勢可能在第一時間佔據先機。

風險與挑戰:時間差/生態較弱/精度格式未明

  1. 上市時間間隔:高通 AI200 2026 年推出,AI250 則預期 2027 年,與 Nvidia 在 Decoder 階段可能搶先的時間差形成弱點。
  2. 生態系統落後:Nvidia 整套從 GPU、系統、軟體到開發工具都成熟,而高通雖強調支援主流框架(PyTorch、ONNX 等) ,但其市場採用率、合作夥伴、生態滲透仍待觀察。
  3. 精度格式未明:目前其他推理晶片越來越多支援 FP4/FP6 等低精度格式以提升效率,但高通在公告中並未明確指出其 AI200/AI250 支援哪些精度格式。
  4. 使命聚焦偏窄:高通這次明確聚焦「推理(inference)」而非「訓練(training)」,對應的是雲端/資料中心模型推理需求,但如果訓練-推理協同變得更重要,或訓練硬體需求彈性增大,這可能限制其發揮。

為什麼這次值得注意?

  • 高通這次不只是「進入資料中心 AI 市場」,而是在架構變革口(disaggregated serving)下注。這意味著未來資料中心不再僅是大 GPU 堆疊,而可能分解為「大量記憶體 + NPU +高速互連」的組合。
  • 而對於其他 GPU/XPU/ASIC 廠商,這/改變了門檻:如果沒有專用「拆解推理晶片/硬體」,未來只能靠軟體改造,恐怕在 C/P 值上處於劣勢。外購高通 AI200 或 Nvidia Rubin CPX 的機櫃,可能讓自研 ASIC 的規模效益變小。
  • 從產業角度看,假設其他雲端服務商(例如 Meta Platforms、Microsoft、Bytedance)也開始布局拆解推理,那麼「推理晶片」將不僅是訓練晶片的附屬,而成為獨立、被設計為可拆解/共享資源的產品類別。
留言
avatar-img
留言分享你的想法!
avatar-img
Tx3獨家分析
42會員
217內容數
Tx3是一個專注於產業財報分析、投資心法與國際趨勢解析的媒體,結合產業第一線脈動、數據驅動的思考,以及全球視野下的策略觀點。 我們不是單純報導新聞,而是以犀利的眼光挑戰框架,用簡明但深刻的語言解構複雜議題,幫助讀者掌握「看懂趨勢、預判未來、做出投資好決策」的核心能力。
Tx3獨家分析的其他內容
2025/10/14
華邦電正站在兩條軌道上,一條是利基 DRAM 的週期性修復(由供需錯配推動),另一條是車用與工控對安全快閃的結構性升級。短期盈虧仍受價格波動擾動;中期關鍵在高雄 12 吋產能與產品組合(Octal NOR/Secure Flash/HyperRAM)帶來的毛利結構改善。如果 DDR4 短缺延續到明年
2025/10/14
華邦電正站在兩條軌道上,一條是利基 DRAM 的週期性修復(由供需錯配推動),另一條是車用與工控對安全快閃的結構性升級。短期盈虧仍受價格波動擾動;中期關鍵在高雄 12 吋產能與產品組合(Octal NOR/Secure Flash/HyperRAM)帶來的毛利結構改善。如果 DDR4 短缺延續到明年
2025/07/03
隨著美元在第二季對台幣出現 12.11% 的大幅貶值,市場關注匯率波動對台灣科技業財報的衝擊。瑞昱擁有 新台幣 46.8 億元的美元淨多頭部位
Thumbnail
2025/07/03
隨著美元在第二季對台幣出現 12.11% 的大幅貶值,市場關注匯率波動對台灣科技業財報的衝擊。瑞昱擁有 新台幣 46.8 億元的美元淨多頭部位
Thumbnail
2025/07/02
汽車電子版圖正快速朝中央運算/域控制器 + 軟體定義車輛(SDV) 收斂,2025年被業界視為高階車用 SoC 大規模落地的關鍵門檻。以下按照製程/代工 → 旗艦級SoC → 域╱網關╱MCU → 時間軸速覽,四層次梳理最新進度。 撰文|編輯部|2025年7月 製程與晶圓代工佈局 TSMC:
Thumbnail
2025/07/02
汽車電子版圖正快速朝中央運算/域控制器 + 軟體定義車輛(SDV) 收斂,2025年被業界視為高階車用 SoC 大規模落地的關鍵門檻。以下按照製程/代工 → 旗艦級SoC → 域╱網關╱MCU → 時間軸速覽,四層次梳理最新進度。 撰文|編輯部|2025年7月 製程與晶圓代工佈局 TSMC:
Thumbnail
看更多
你可能也想看
Thumbnail
隨著近年來的AI浪潮,讓大家普遍對於AI後續的發展充滿了期待。今年所舉辦的台北電腦展 (Computex),讓這樣的相關的討論更加熱烈。有在投資的讀者們或多或少都會看到相關產業鏈的梳理,像是AI伺服器需要什麼奈米的晶圓製程、需要那些先進封裝測試技術、需要什麼樣的水冷技術、哪些的OEM廠 (O
Thumbnail
隨著近年來的AI浪潮,讓大家普遍對於AI後續的發展充滿了期待。今年所舉辦的台北電腦展 (Computex),讓這樣的相關的討論更加熱烈。有在投資的讀者們或多或少都會看到相關產業鏈的梳理,像是AI伺服器需要什麼奈米的晶圓製程、需要那些先進封裝測試技術、需要什麼樣的水冷技術、哪些的OEM廠 (O
Thumbnail
先前有消息指出,為了將低對外購 AI 晶片的依賴,微軟投資支持的生成式 AI 應用大廠 OpenAI 已經開始自行設計與生產相關晶片的計畫,並且已經接觸了包括博通 (Broadcom) 等多家晶片大廠。
Thumbnail
先前有消息指出,為了將低對外購 AI 晶片的依賴,微軟投資支持的生成式 AI 應用大廠 OpenAI 已經開始自行設計與生產相關晶片的計畫,並且已經接觸了包括博通 (Broadcom) 等多家晶片大廠。
Thumbnail
在半導體科技頂端的台積電和ASML都發布了財報,面臨回檔壓力的AI半導體還有戲嗎?
Thumbnail
在半導體科技頂端的台積電和ASML都發布了財報,面臨回檔壓力的AI半導體還有戲嗎?
Thumbnail
今天是美西時間6/18, 主要搜集第一天的主要對搭載高通新處理器( Snapdragon X Elite) 的AI PC 測試報告外以及市場對AI PC的反應, 並著眼於相關AI PC概念股, 高通與ARM的股價未來反應與展望。
Thumbnail
今天是美西時間6/18, 主要搜集第一天的主要對搭載高通新處理器( Snapdragon X Elite) 的AI PC 測試報告外以及市場對AI PC的反應, 並著眼於相關AI PC概念股, 高通與ARM的股價未來反應與展望。
Thumbnail
NVIDIA、Intel、Tenstorrent和RISC-V在AI半導體領域的競爭和合作。Intel在AI領域推出了一系列產品,Tenstorrent和Rapidus合作開發新技術,而RISC-V開放源碼指令集架構也受到了廣泛關注。這些內容都展示了AI半導體市場的技術革新和競爭激烈的情況。
Thumbnail
NVIDIA、Intel、Tenstorrent和RISC-V在AI半導體領域的競爭和合作。Intel在AI領域推出了一系列產品,Tenstorrent和Rapidus合作開發新技術,而RISC-V開放源碼指令集架構也受到了廣泛關注。這些內容都展示了AI半導體市場的技術革新和競爭激烈的情況。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
根據高盛最近的研究報告,未來的個人電腦和移動設備將搭載更多由AI增強後的應用程式,如AI增強、安全性提升和運算能力強化。 消費性電子股票組合<GSXUPCAI>也顯示出潛力,並列出了成分股以及其權重。
Thumbnail
根據高盛最近的研究報告,未來的個人電腦和移動設備將搭載更多由AI增強後的應用程式,如AI增強、安全性提升和運算能力強化。 消費性電子股票組合<GSXUPCAI>也顯示出潛力,並列出了成分股以及其權重。
Thumbnail
AI應用遍地開花,討論AI晶片的同時,也來認識一下台積電的其中一項先進封裝技術CoWoS,本篇試圖簡單說明。
Thumbnail
AI應用遍地開花,討論AI晶片的同時,也來認識一下台積電的其中一項先進封裝技術CoWoS,本篇試圖簡單說明。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News