NVIDIA 執行長黃仁勳 CES 2025 演講重點整理
🔴 GeForce RTX 50 系列 Blackwell 架構 GPU
- RTX 5090 擁有 920 億個晶體管、4000 TOPS 以及 4 個 Petaflops 的 AI 效能。
- 與前一代 Ada 相比,效能提升三倍。
- RTX 5070 效能等同於 RTX 4090,售價 549 美元。
- G7 記憶體來自美光,速度為每秒 1.8TB,是前一代的兩倍。
- 可編程著色器現在也能處理神經網路。
- 運用 AI 學習紋理和壓縮演算法,產生更精美的圖像。
🔵 NVLink 系統
- GB200 NVLink 72 重達一噸半,由 60 萬個零件組成。
- 耗電量 120kW,內部有兩英里的銅纜和 5000 條纜線。
- 在全球 45 家工廠生產,並於數據中心現場組裝。
- 與前一代 Blackwell 相比,每瓦效能提高四倍,每美元效能提高三倍。
- 在一代之內,訓練模型的成本將降低三倍,或模型規模增加三倍,成本維持不變。
🟢 AI Tokens 的重要性
- ChatGPT、Gemini 等 AI 應用程式都需要大量的 AI tokens。
- AI tokens 是由大型 AI 系統生成的。
- Blackwell 架構的每瓦效能提升,代表數據中心的產能和利潤都將增加。
🔴 代理式 AI
- 代理式 AI 是一種在測試時間擴展的完美範例。
- 它可以理解、與客戶和用戶互動、檢索資訊、使用工具和生成式 AI。
- 未來,AI 將使用測試時間擴展來處理更複雜的任務。
- 推理所需的計算量將會大幅增加。
🔵 NVIDIA 的 AI 策略
- 與軟體開發人員合作,將 AI 技術整合到企業應用程式中。
- 開發 AI 庫,提供加速計算和 AI 功能。
NVIDIA AI 產品和服務
🔵 NVIDIA Nims
- 一個整合 AI 微服務的平台。
- 包含視覺、語言理解、語音和物理 AI 模型。
- 可以在所有雲端平台和 OEM 設備上運行。
🔵 NVIDIA Nemo
- 一個數位員工入職和培訓評估系統。
- 可以訓練和管理企業內的 AI 代理。
- 提供不同的庫,幫助 AI 代理適應企業的語言、流程和工作方式。
- IT 部門將成為 AI 代理的人力資源部門。
🔵 NVIDIA Llama Nemotron 語言基礎模型
- 基於 Llama 3.1 模型,經過 NVIDIA 的微調和優化。
- 提供不同大小和效能的模型,包括超級版和教師模型。
- 在聊天、教學和檢索等方面表現出色。
🔴 NVIDIA Cosmos 世界基礎模型
- 基於 2000 萬小時的影片訓練,專注於物理動態。
- 可以用於合成數據生成、機器人訓練和多模態大型語言模型訓練。
- 開放授權,可在 GitHub 上使用。
🔵 NVIDIA Omniverse
- 一個基於物理原則的模擬系統。
- 與 Cosmos 結合,可以生成基於真實物理基礎的多元宇宙。
- 應用於機器人技術和工業應用。
NVIDIA 新產品發表
🔴 Thor 機器人電腦
- 處理能力是前一代 Orin 的 20 倍。
- 可用於自動移動機器人、類人機器人和自動駕駛車輛。
🟢 安全駕駛作業系統
- 獲得 ANSI D 功能安全認證,是汽車領域的最高標準。
🔴 通用機器人
- 通用機器人的 ChatGPT 時刻即將來臨。
- 三種主要類型:代理式機器人、自駕車和類人機器人。
🔵 Project Digits AI 超級電腦
- 運行完整的 NVIDIA AI 堆疊。
- 基於 GB10 超級晶片,由 NVIDIA 與聯發科技合作開發。
- 預計於 2025 年 5 月上市。