蘋果在 2024 年 WWDC 推出「Apple Intelligence」,強調 iPhone 將成為個人化 AI 體驗的核心。A18 Pro 晶片的 35 TOPS NPU 性能與 Private Cloud Compute(PCC)技術備受矚目,承諾提供安全、隱私優先的 On-device 與雲端混合 AI 服務。然而,在業界追求更大規模模型與雲端基礎設施的背景下,Apple 的 AI 策略面臨諸多挑戰。本文將分析 A18 NPU 的能力、Apple 的 AI 基礎設施現況、商業模式可能性及隱私承諾的潛在矛盾,探討其未來發展,而在今年的 WWDC 2025 卻輕描淡寫過去,令人匪夷所思。
A18 Pro NPU:35 TOPS 的實力與侷限
性能概述
A18 Pro 晶片的 NPU 提供 35 TOPS(每秒 35 萬億次運算,INT8 低精度),相較前代 M2 Ultra(31.6 TOPS)有所提升,與 Qualcomm Snapdragon 8 Gen 3(約 45 TOPS)競爭對手處於同一量級。Apple 強調此性能支持 On-device AI 推論,如語音處理、圖像識別及簡單的 Siri 指令。
實際應用能力
35 TOPS 在運行小型模型(如 1-3B 參數的量化模型)時表現良好,但對於 Mistral 7B 或 LLaMA 8B 等中型模型則顯得吃力。這些模型需約 5-10 GB 記憶體與持續數十 TOPS 算力,而 iPhone 的 8GB RAM 與 NPU 性能難以全程 On-device 流暢運行,特別是在長上下文或多模態任務中。
Apple 在 WWDC 2024 明確表示,Apple Intelligence 採用 On-device 與雲端混合模式。簡單任務(如本地文本生成)可在設備端完成,複雜任務(如圖像生成或跨 App 操作)則依賴 Private Cloud Compute(PCC)。這一策略緩解了 NPU 的限制,但也凸顯了對雲端算力的依賴。
Apple 的 AI 基礎設施:進展與差距
現況分析
Apple 透過 PCC 提供雲端 AI 算力,使用 Apple Silicon 伺服器並強調端到端加密與資料不留存。然而,Apple 未公開 PCC 的具體規模、伺服器數量或投資金額。相比之下,Google(TPU v5p)、Microsoft(Azure AI 集群)及 Meta(Llama 訓練集群)均披露了數萬顆 GPU 或自研晶片的基礎設施細節。
供應鏈挑戰
當前高端 GPU(如 NVIDIA H100)供不應求,Meta、Google 等公司已簽署長期採購合約。Apple 主要依賴自研 Apple Silicon,而非 NVIDIA GPU,但若需大幅擴展 PCC,可能需採購 AMD 或其他供應商的晶片,面臨供應鏈競爭壓力。儘管如此,Apple 與 TSMC 的緊密合作與雄厚財力使其有能力快速追趕。
與競爭對手的差距
Google 和 Microsoft 在 AI 基礎設施的透明度與規模上領先,Meta 亦定期更新其 AI Infra 進度。Apple 的低調可能反映其策略選擇(專注用戶體驗而非技術規格),但也可能暗示其雲端算力布局尚未成熟。公開資料不足以斷定 Apple「遠落後」,但其基礎設施規模確實不如競爭對手透明。
Cloud LLM 的成本與商業模式
推論成本
雲端 LLM 推論成本高昂。例如,OpenAI 的 GPT-4o API 費用約為每百萬 token $5-$20。若 Apple 的 Siri LLM 每日服務數億 iPhone 用戶,後端成本將相當可觀。Apple 需平衡性能與成本,確保 PCC 的可持續運營。
可能的商業模式
Apple 未在 WWDC 2024 公布 AI 功能的收費計畫,但業界推測其可能將進階 AI 功能整合至 iCloud+ 訂閱,或推出獨立 AI 服務方案。對比 Google 的 Gemini Advanced(每月 $19.99)與 Microsoft 365 Copilot(每月 $30/用戶),此模式符合行業趨勢。然而,額外收費可能挑戰 Apple「買斷即用」的品牌形象,用戶接受度仍待觀察。
隱私承諾與雲端 AI 的平衡
隱私挑戰
Apple 長年以「隱私至上」為品牌核心,強調資料不離開設備。PCC 採用端到端加密,承諾雲端資料不儲存或用於訓練,但雲端推論仍需上傳用戶查詢與上下文資料。這與「On-device 隱私」的敘事存在潛在矛盾,引發業界質疑(如 The Verge 報導)。用戶可能關心資料是否真正安全,尤其在跨國法規(如 GDPR)下。
Apple 的應對
Apple 透過 PCC 的技術設計(資料隔離、不可追溯)試圖緩解隱私疑慮,並允許第三方審計其安全機制。然而,雲端 AI 的本質決定了資料必須離開設備,Apple 需在技術與溝通上進一步證明其隱私承諾的可信度。
Siri LLM 的開發進度
技術挑戰
Apple 正在研發 LLM 驅動的 Siri(內部或稱「Siri 2.0」),計劃於 2025 年推出更強大的語音與上下文理解功能。然而,Siri 的歷史架構非 LLM 原生,語音解析與指令執行的整合存在技術債 (之前採用的是空格填填看的設計方式)。iOS 18.1 beta 已展示部分 Apple Intelligence 功能(如跨 App 整合),但目前僅限特定語言,且功能受限,顯示工程挑戰尚未完全克服。
交付展望
Bloomberg 報導指出,Apple 計劃在 2025 年逐步擴展 Siri LLM 功能。儘管進度不如外界預期快速,但 Apple 的生態整合能力(iOS、macOS、App Store)與財力為其提供優勢。Siri LLM 的廣泛可用仍需時間,具體交付時程有待後續更新。
Apple 為何低調布局 AI 基礎設施?
Apple 未公開 AI 基礎設施細節,可能出於以下考量:
- 隱私敘事:大規模雲端布局可能引發用戶對資料安全的質疑,與「隱私至上」形象不符。
- 策略選擇:Apple 一貫專注用戶體驗而非技術規格,低調布局避免被捲入 AI 軍備競賽。
- 商業模式未定:未明確 AI 服務的變現路徑前,公開大規模投資可能引發股東對 ROI 的關切。
- 工程進度:Siri LLM 與 PCC 的整合需時間,過早公開可能推高市場期待。
這些考量反映 Apple 的謹慎策略,而非必然落後於競爭對手。
結語:Apple Intelligence 的機遇與挑戰
Apple Intelligence 展現了 Apple 在 AI 領域的雄心,A18 Pro 的 35 TOPS NPU 與 PCC 技術為其奠定了基礎。然而,On-device 算力的限制、雲端基礎設施的透明度不足、Siri LLM 的工程挑戰及潛在的付費模式均為未解難題。Apple 的生態整合、財力與隱私技術是其優勢,但能否在 2025 年兌現承諾,需視其後續執行力而定。
用戶是否願意為進階 AI 功能付費?例如每個月多10美元? (約新台幣300元) Apple 的隱私承諾能否經受市場考驗?這些問題將決定 Apple Intelligence 的成敗。未來一年,Apple 的 AI 布局值得持續關注。