Nvidia 的 Blackwell 系列 GPU GB200系列原本預計在 2024 年下半年推出,但由於生產遭遇重大挑戰,導致發貨延遲並迫使 Nvidia 重新設計系統架構。根據 SemiAnalysis 的分析文章,主要問題來自於以下幾個方面:
1. CoWoS-L 封裝技術的挑戰:
Blackwell GPU 採用了台積電最新的 CoWoS-L 封裝技術,這是一種複雜且產能有限的技術。由於是首次大規模應用於高階產品,因此在生產過程中出現了一些問題,例如:
2. 供應鏈問題:
除了封裝技術的挑戰外,Nvidia 還面臨著供應鏈方面的問題,例如:
Nvidia 的應對措施:
為了解決這些問題,Nvidia 採取了以下措施:
影響:
這些問題和應對措施將對 Nvidia 和整個 GPU 市場產生重大影響:
總結:
Nvidia Blackwell 系列 GPU 的生產問題凸顯了先進封裝技術和供應鏈管理的重要性。雖然 Nvidia 正在努力解決這些問題,但預計在短期內仍將面臨挑戰。
圖一、新舊伺服器推出時程差異
圖二、目前的消耗熱瓦數
圖三、CoWoS-L晶片翹曲問題
其他討論 Nvidia Blackwell 系列 GPU 的生產挑戰的文章:
1. The Register - “據報道,Nvidia 將 Blackwell GPU 推遲到 2025 年”
重點:本文證實了有關 Blackwell GPU 發貨延遲的信息,將發佈時間推遲到了 2025 年第一季度。
重要細節:它特別指出台積電 CoWoS(晶圓上晶片)封裝技術的複雜性是製造過程中的主要障礙。
重點:本報告強調,設計缺陷導致 Nvidia 的新型 AI 晶片(可能指的是 Blackwell 架構)的延遲。
重要細節:延遲的影響延伸到了微軟、谷歌和 Meta 等主要科技公司,它們是 Nvidia 人工智慧硬體的主要消費者。這表明這些生產問題對市場產生了重大影響。
3. Reddit 討論 - “新傳言稱 Nvidia 的下一代 Blackwell 卡不會有更寬的內存總線或更多的 VRAM——除了 RTX 5090”
重點:雖然這是 Reddit 討論而不是正式新聞文章,但它反映了技術社群內流傳的有關 Blackwell 架構潛在局限性的謠言。
重要細節:討論表明,除了最高階的 RTX 5090 之外,Blackwell GPU 可能不會在記憶體頻寬或容量方面進行重大升級。這可能表明英偉達為克服生產挑戰而做出的設計選擇或產品策略的轉變。
總而言之,Nvidia Blackwell 系列 GPU 面臨的生產挑戰似乎源自於多種因素的綜合作用:
先進封裝技術:台積電的 CoWoS-L 技術雖然前景廣闊,但對於 Blackwell GPU 等大批量產品來說卻存在重大製造障礙。
潛在的設計缺陷:報告表明,最初的布萊克韋爾設計可能存在固有缺陷,導致生產良率和延遲。
供應鏈限制:與其他半導體公司一樣,英偉達也可能面臨持續的供應鏈限制,這進一步加劇了情況。
這些問題導致出貨延遲,影響了 Nvidia 的市場地位,並可能影響 Blackwell GPU 的最終設計和規格。它凸顯了晶片製造商在突破半導體技術界限時所面臨的日益複雜性和挑戰。
重要參考資料:https://www.semianalysis.com/p/nvidias-blackwell-reworked-shipment