從 Live Data Streaming 看華為與 NVIDIA AI 晶片架構的分歧:誰才是真正為未來設計的 AI

更新於 發佈於 閱讀時間約 8 分鐘

AI 晶片的競爭往往聚焦於算力指標,如 TFLOPs、TOPS 或製程技術。然而,在大模型普及的 2025 年,Live Data Streaming(即時資料串流)正重新定義 AI 平台的價值。來自中國的華為昇騰 910B與美國的NVIDIA H100在理論性能上旗鼓相當,但其架構設計哲學在應對動態資料流時展現顯著差異。本文將深入分析兩者在即時資料處理中的表現,並探討誰更能適應未來的 AI 應用需求。

離線算力對決:昇騰與 NVIDIA 的性能基準

根據華為官方資料,昇騰 910B 支援最高 320 TFLOPs(BF16) 和 640 TOPS(INT8),採用 7nm 製程,單晶片算力接近 NVIDIA A100(312 TFLOPs,BF16)。然而,MLPerf 基準測試(2024 年最新報告)顯示,昇騰 910B 在 ResNet-50 訓練任務中,吞吐量約為 A100 的 85%,主要受限於 MindSpore 框架的優化程度 [1]。

華為的 CloudMatrix 叢集(384 顆昇騰 910B)宣稱總算力達 300 PFLOPs,採用 HCCS 互連(頻寬 900 GB/s)。相較之下,NVIDIA 的 DGX H100 叢集(8 顆 H100,NVLink 4.0,頻寬 3 TB/s)在 MLPerf 語言模型訓練中展現更高擴展效率,通信延遲低至 1.2 微秒 [2]。這些數據表明,在離線訓練場景下,NVIDIA 的硬體互連與軟體棧更具優勢,但昇騰在算力密度和功耗(約 310W 對比 H100 的 700W)上表現出色。

然而,離線訓練假設資料已靜態儲存並可批量處理。在真實世界中,AI 應用日益依賴即時生成、非同步的動態資料流,這對晶片架構提出了全新挑戰。

即時資料串流:AI 平台的新戰場

2025 年的 AI 應用,從智慧城市交通到實時推薦系統,均要求模型基於動態資料流持續演進。這些資料流具有多源頭、異構格式、高延遲敏感性等特徵,驅使 AI 平台不僅追求算力,更需高效協調資料處理流程,包括:

  • 非同步資料接收
  • 快速預處理(如轉碼、解壓)
  • 動態小批次訓練(Dynamic Batching)
  • 模型增量更新(Incremental Training)

例如,某電商平台的實時推薦系統每天處理約 5 PB 的非結構化資料(點擊流、用戶行為 / 估算值),要求模型每天更新一次以適應用戶偏好變化 [3]。這類場景考驗晶片的資料吞吐與軟體生態的整合能力。

NVIDIA 的 Streaming-Native 生態:從 DALI 到 Triton

NVIDIA 在即時資料處理中擁有成熟的工具鏈:

  • DALI(Data Loading Library):支援非同步圖片/影片預處理,與 GPU 流水線無縫整合。在 1080p 影片解碼任務中,DALI 比 CPU 預處理快 3.5 倍 [4]。
  • Triton Inference Server:支援多模型動態切換,整合 Apache Kafka 實現資料流推論,延遲低至 10 毫秒,適合實時語音或視覺應用 [5]。
  • PyTorch + TorchData:提供 DataPipe 框架,支援分散式資料流處理,與 Kafka、Spark 等企業級平台相容。

NVIDIA 的 CUDA 生態(涵蓋 4000+ 開源庫)進一步降低了開發門檻。例如,某自動駕駛公司利用 Triton + DALI 實現了每秒 30 幀的道路物件檢測,模型更新週期縮短至 15 分鐘 [6]。

華為昇騰的優勢與挑戰:本地化與生態瓶頸

昇騰 910B 的設計強調計算密度與能效,HCCS 互連支援高效晶片間通信,適合大規模離線訓練。例如,中國某超算中心採用 CloudMatrix 訓練多模態大模型,功耗比 NVIDIA 叢集低 20% [7]。此外,昇騰在中國市場具備本地化優勢,與鯤鵬伺服器、鴻蒙系統整合,廣泛應用於智慧城市與工業 IoT 項目。

然而,昇騰的軟體棧 MindSpore 在即時資料處理中存在局限:

  • 有限的流式支援:MindSpore 2.3 版對 Kafka 的原生整合僅支援基本消息隊列,缺乏類似 PyTorch DataPipe 的動態批次處理功能 [8]。
  • 生態成熟度:截至 2025 年,MindSpore 開源社區貢獻者約 2000 人,遠低於 PyTorch 的 1.8 萬人,導致多模態 DataLoader 等模組開發滯後 [9]。
  • 部署複雜性:開發者需透過 ModelArts 中間件串接 IoT 或語音數據,增加 20%-30% 的部署時間 [10]。

儘管如此,華為積極補足短板。例如,2024 年推出的 ModelArts 4.0 增強了流式數據預處理能力,支援 H.265 影片解碼,性能接近 DALI [11]。

地緣政治影響:華為的外部挑戰

美國對華為的技術制裁(包括先進製程與 EDA 工具限制)影響了昇騰的硬體迭代與全球生態擴展。儘管華為透過自研 7nm 製程與 MindSpore 維持競爭力,但與 NVIDIA 的 4nm H100(2024 年量產)相比,製程差距可能在 2026 年進一步擴大 [12]。然而,中國市場的政策支持(如國產化採購)為昇騰提供了穩定需求,2024 年昇騰在中國 AI 晶片市場佔比達 25% [13]。

誰是未來 AI 平台?

在即時資料串流時代,AI 平台的競爭力取決於「資料與運算的協同效率」。綜合分析:

  • 離線訓練場景:昇騰 910B 憑藉高能效與本地化優勢,適合中國市場的大規模語言模型訓練,成本約為 NVIDIA 方案的 70% [14]。
  • 即時資料應用:NVIDIA H100 憑藉成熟的軟體生態與高效資料流水線,在推薦系統、自動駕駛等場景中更具適應性,開發週期可縮短 30% [15]。

未來的 AI 平台不再是單純的算力競賽,而是資料節奏與運算能力的共舞。NVIDIA 目前在全球市場佔據領先,但華為在本地化場景與成本控制上的潛力不容忽視。

參考文獻

  1. MLPerf Training v4.0 Results, 2024.
  2. NVIDIA DGX H100 Technical Whitepaper, 2024.
  3. Alibaba Cloud, "Real-Time Recommendation System Case Study," 2024.
  4. NVIDIA DALI Documentation, 2025.
  5. Triton Inference Server User Guide, 2024.
  6. NVIDIA Automotive Summit, 2024.
  7. China Supercomputing Center Report, 2024.
  8. MindSpore 2.3 Release Notes, 2024.
  9. GitHub Community Metrics, 2025.
  10. Huawei ModelArts Developer Feedback, 2024.
  11. Huawei Cloud ModelArts 4.0 Announcement, 2024.
  12. TSMC Industry Report, 2025.
  13. IDC China AI Chip Market Analysis, 2024.
  14. Huawei Ascend Cost Analysis, 2024.
  15. NVIDIA Developer Survey, 2024.
留言
avatar-img
留言分享你的想法!
avatar-img
Stan Wu 吳信典
14會員
111內容數
我是 Stan Wu 吳信典。 我相信:「我們從程式設計的邏輯世界走來,以為萬物都能被預測與控制,直到遇見 AI,才發現智慧不只是規則的堆疊,而是滲透在無數經驗中的模糊與真實。」 我也始終堅信:「簡單,就是極致的美學。」
Stan Wu 吳信典的其他內容
2025/06/22
美國轟炸伊朗核設施引發油價飆升與地緣緊張,影響台灣出口、匯率與外資動向。新台幣短期可能在29.75附近徘徊,惟若外資撤出或關稅上升,恐貶至31以上。央行強調穩定匯率、避免炒作,並保留干預空間。
Thumbnail
2025/06/22
美國轟炸伊朗核設施引發油價飆升與地緣緊張,影響台灣出口、匯率與外資動向。新台幣短期可能在29.75附近徘徊,惟若外資撤出或關稅上升,恐貶至31以上。央行強調穩定匯率、避免炒作,並保留干預空間。
Thumbnail
2025/06/22
台灣鮮奶價格排名世界第二高、營養誤解、乳糖不耐...你還相信鮮奶是健康保證嗎?在台灣,鮮奶長年被視為健康與營養的象徵。從小學早餐到超市貨架,無不訴說著一個訊息:「喝牛奶才健康」。但這項根深柢固的日常選擇,真的理性嗎?我們有沒有可能,其實並不一定非鮮奶不可?
Thumbnail
2025/06/22
台灣鮮奶價格排名世界第二高、營養誤解、乳糖不耐...你還相信鮮奶是健康保證嗎?在台灣,鮮奶長年被視為健康與營養的象徵。從小學早餐到超市貨架,無不訴說著一個訊息:「喝牛奶才健康」。但這項根深柢固的日常選擇,真的理性嗎?我們有沒有可能,其實並不一定非鮮奶不可?
Thumbnail
2025/06/19
在大型語言模型(LLM)如 GPT-4、Claude 3、Gemini 正在改寫生產力的同時,另一股勢力也正在悄悄崛起──小模型(Small Language Models, SLM)。
Thumbnail
2025/06/19
在大型語言模型(LLM)如 GPT-4、Claude 3、Gemini 正在改寫生產力的同時,另一股勢力也正在悄悄崛起──小模型(Small Language Models, SLM)。
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
隨著近年來的AI浪潮,讓大家普遍對於AI後續的發展充滿了期待。今年所舉辦的台北電腦展 (Computex),讓這樣的相關的討論更加熱烈。有在投資的讀者們或多或少都會看到相關產業鏈的梳理,像是AI伺服器需要什麼奈米的晶圓製程、需要那些先進封裝測試技術、需要什麼樣的水冷技術、哪些的OEM廠 (O
Thumbnail
隨著近年來的AI浪潮,讓大家普遍對於AI後續的發展充滿了期待。今年所舉辦的台北電腦展 (Computex),讓這樣的相關的討論更加熱烈。有在投資的讀者們或多或少都會看到相關產業鏈的梳理,像是AI伺服器需要什麼奈米的晶圓製程、需要那些先進封裝測試技術、需要什麼樣的水冷技術、哪些的OEM廠 (O
Thumbnail
先前有消息指出,為了將低對外購 AI 晶片的依賴,微軟投資支持的生成式 AI 應用大廠 OpenAI 已經開始自行設計與生產相關晶片的計畫,並且已經接觸了包括博通 (Broadcom) 等多家晶片大廠。
Thumbnail
先前有消息指出,為了將低對外購 AI 晶片的依賴,微軟投資支持的生成式 AI 應用大廠 OpenAI 已經開始自行設計與生產相關晶片的計畫,並且已經接觸了包括博通 (Broadcom) 等多家晶片大廠。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
根據高盛最近的研究報告,未來的個人電腦和移動設備將搭載更多由AI增強後的應用程式,如AI增強、安全性提升和運算能力強化。 消費性電子股票組合<GSXUPCAI>也顯示出潛力,並列出了成分股以及其權重。
Thumbnail
根據高盛最近的研究報告,未來的個人電腦和移動設備將搭載更多由AI增強後的應用程式,如AI增強、安全性提升和運算能力強化。 消費性電子股票組合<GSXUPCAI>也顯示出潛力,並列出了成分股以及其權重。
Thumbnail
NVIDIA 黃仁勳 - AI人工智慧時代如何帶動全球新產業革命(個人紀錄用) 🇺🇸Omniverse 就是未來集大成,而加速運算、人工智慧就是兩個最重要的技術核心 🇺🇸CPU效能的擴充速度正在大幅降低,提出「運算通膨」概念
Thumbnail
NVIDIA 黃仁勳 - AI人工智慧時代如何帶動全球新產業革命(個人紀錄用) 🇺🇸Omniverse 就是未來集大成,而加速運算、人工智慧就是兩個最重要的技術核心 🇺🇸CPU效能的擴充速度正在大幅降低,提出「運算通膨」概念
Thumbnail
NVIDIA在人工智慧處理專用GPU領域的地位牢固,但面臨著來自英特爾和超微半導體等競爭對手的反擊。新興企業也加入競爭,使得競爭更加激烈。未來,合作關係將變得至關重要,NVIDIA和其他競爭對手在激烈的競爭中脫穎而出的關鍵。
Thumbnail
NVIDIA在人工智慧處理專用GPU領域的地位牢固,但面臨著來自英特爾和超微半導體等競爭對手的反擊。新興企業也加入競爭,使得競爭更加激烈。未來,合作關係將變得至關重要,NVIDIA和其他競爭對手在激烈的競爭中脫穎而出的關鍵。
Thumbnail
2022年11月30日,ChatGPT的登場對全球造成了顯著衝擊。隨後,2024年2月15日,OpenAI發布了能夠將文字轉換為圖像的AI模型SORA,這一創新再次引發了巨大的震動。 這兩大創新引發的全球算力需求的增長幅度是前所未有的。 需求的瞬間迅猛增長,但供應的增加卻需要更長的時間。Nv
Thumbnail
2022年11月30日,ChatGPT的登場對全球造成了顯著衝擊。隨後,2024年2月15日,OpenAI發布了能夠將文字轉換為圖像的AI模型SORA,這一創新再次引發了巨大的震動。 這兩大創新引發的全球算力需求的增長幅度是前所未有的。 需求的瞬間迅猛增長,但供應的增加卻需要更長的時間。Nv
Thumbnail
NVIDIA的Blackwell計算平台代表著實時生成式AI應用的重大進步,旨在滿足跨行業挑戰。此平台提升了計算效能,促進了AI在實體世界的應用,並對從自動駕駛到醫療診斷等多個領域產生了深遠影響。NVIDIA 黃仁勳的願景是將AI技術從虛擬世界帶入現實,為創新開闢新道路,一個更加智慧和互聯的未來。
Thumbnail
NVIDIA的Blackwell計算平台代表著實時生成式AI應用的重大進步,旨在滿足跨行業挑戰。此平台提升了計算效能,促進了AI在實體世界的應用,並對從自動駕駛到醫療診斷等多個領域產生了深遠影響。NVIDIA 黃仁勳的願景是將AI技術從虛擬世界帶入現實,為創新開闢新道路,一個更加智慧和互聯的未來。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News