NVIDIA Llama Nemotron系列:開源AI推理新突破,效能超越DeepSeek-R1

更新 發佈閱讀 6 分鐘

NVIDIA前陣子推出了Llama-Nemotron系列,這是一組專為高效AI推理和代理工作流程設計的開源推理模型。本文將討論Llama-Nemotron系列的發布、開源特性,以及其與DeepSeek-R1的效能比較。

raw-image

Llama-3.1-Nemotron-Ultra-253B-v1


NVIDIA Llama-Nemotron系列:三款模型滿足多元需求

NVIDIA於2025年5月正式發布Llama-Nemotron系列,包含三款模型,針對不同應用場景進行最佳化:

  1. Nano (8B參數):適合個人電腦和邊緣設備,輕量高效,適用於資源受限環境。
  2. Super (49B參數):針對單GPU設定,提供卓越的性能與靈活性。
  3. Ultra (253B參數):專為多GPU伺服器設計,支援高達128K token的上下文長度,適用於複雜的企業級應用。

這些模型基於Meta的Llama-3.1-405B-Instruct架構,經過NVIDIA的後訓練最佳化,顯著提升了在推理、數學、程式設計和決策制定等方面的表現。尤其是Llama-3.1-Nemotron-Ultra-253B-v1,在多項基準測試中與DeepSeek-R1等頂尖模型競爭,展現了其高效能與高效率的優勢。

此外,NVIDIA於在arXiv發布了詳細的技術報告,涵蓋監督微調(SFT)、大規模強化學習(RL)及模型評估細節。報告還公開了訓練數據,包括NVIDIA Llama Nemotron Post-Training Dataset和OpenCodeReasoning Dataset,為開發者提供了高度透明的資源。

arXiv:Llama-Nemotron: Efficient Reasoning Models


Llama-Nemotron的開源透明

模型權重開放

Llama-Nemotron系列的模型權重(Nano 8B、Super 49B、Ultra 253B)以Apache 2.0許可證發布,開發者可透過Hugging Face等平台自由下載、使用、修改和部署,為AI社群提供了低門檻的創新機會。

訓練數據公開

NVIDIA不僅公開模型權重,還釋出了大量訓練數據,包括後訓練數據集和程式推理數據集。這些數據集包含合成數據和人工標註數據,專為推理、數學和程式設計任務設計。這種透明度在高性能模型中極為罕見,進一步推動了AI研究的民主化。

訓練框架與工具

NVIDIA提供了開源的NeMo框架,用於訓練Llama-Nemotron模型,並附有詳細的訓練流程、神經架構搜尋(NAS)和後訓練技術文檔,此外,NVIDIA的NIM微服務和評估基準也向公眾開放,提升了模型的實用性。

raw-image

Llama-3.1-Nemotron-Ultra-253B-v1


Llama-Nemotron vs. DeepSeek-R1

整體競爭力與排名

根據獨立評測機構Artificial Analysis的2025年4月數據,Llama-3.1-Nemotron-Ultra-253B(LN-Ultra)以61分的成績,略高於DeepSeek-R1的60分,成為最「智慧」的開源模型。這顯示LN-Ultra在推理能力上已達到業界領先水平。

推理效率

LN-Ultra在推理效率上展現了顯著優勢。透過Puzzle架構(神經架構搜尋)和FFN Fusion技術,LN-Ultra能在單一8xH100節點上高效運行,而DeepSeek-R1則需8xH200節點。在GPQA-Diamond基準測試中,LN-Ultra的吞吐量比DeepSeek-R1高出1.71倍,推理延遲顯著改善。

推理能力

LN-Ultra在GPQA-Diamond基準測試中達到76.0%的準確度,超越DeepSeek-R1的71.5%,創下開源模型的新紀錄。透過大規模強化學習,LN-Ultra在推理任務中甚至超越其教師模型DeepSeek-R1。此外,在JudgeBench等超分佈任務上,LN-Ultra也表現出色,穩坐最佳開源模型寶座。

其他基準測試

LN-Ultra在AIME24、AIME25、MATH500和LiveCodeBench等推理基準測試中,表現與DeepSeek-R1相當或更佳。即使在非推理任務(如BFCL V2 Live和IFEval),LN-Ultra也保持與頂尖模型的競爭力。


NVIDIA的Llama-Nemotron系列在推理能力和效率上超越DeepSeek-R1,說明最強開源模型的良性競爭仍在持續中,也能造福更多AI研究等領域。
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~

也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!

>>>請我喝一杯咖啡

留言
avatar-img
TN科技筆記(TechNotes)的沙龍
70會員
219內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/05/09
Mistral AI於2025年5月7日推出 Mistral Medium 3,以高效能、低成本和企業級應用為核心,挑戰市場上的頂尖模型。這款模型不僅在效能上媲美Anthropic的Claude Sonnet 3.7,更以低至8倍的成本優勢,成為企業數位轉型的理想選擇。
Thumbnail
2025/05/09
Mistral AI於2025年5月7日推出 Mistral Medium 3,以高效能、低成本和企業級應用為核心,挑戰市場上的頂尖模型。這款模型不僅在效能上媲美Anthropic的Claude Sonnet 3.7,更以低至8倍的成本優勢,成為企業數位轉型的理想選擇。
Thumbnail
2025/05/07
Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06,似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的編碼能力、前端網頁開發表現,以及多模態應用的突破,成為最新的AI焦點。
Thumbnail
2025/05/07
Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06,似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的編碼能力、前端網頁開發表現,以及多模態應用的突破,成為最新的AI焦點。
Thumbnail
2025/05/04
2025 年 5 月,Suno 推出 V4.5 版本帶來更強大的功能。然而,隨著 Suno 和其他 AI 音樂生成服務的崛起,AI 音樂生成的版權爭議也日益浮出水面。本文將介紹 Suno V4.5 的更新特色、比較其他知名 AI 音樂生成服務,並探討 AI 音樂的版權問題。
Thumbnail
2025/05/04
2025 年 5 月,Suno 推出 V4.5 版本帶來更強大的功能。然而,隨著 Suno 和其他 AI 音樂生成服務的崛起,AI 音樂生成的版權爭議也日益浮出水面。本文將介紹 Suno V4.5 的更新特色、比較其他知名 AI 音樂生成服務,並探討 AI 音樂的版權問題。
Thumbnail
看更多
你可能也想看
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
文章探討近期銀行對於房貸申請的態度轉變,特別是財力一般的客戶面臨的困難,並介紹「國峰厝好貸」作為民間二胎房貸的選項。分析其優缺點,包括不受央行禁令影響、審核快速、核准率高等優勢,以及較高的利率(7%-16%)和民間借貸的風險。作者提醒讀者,若非走投無路,應謹慎評估,並建議諮詢專業人士。
Thumbnail
文章探討近期銀行對於房貸申請的態度轉變,特別是財力一般的客戶面臨的困難,並介紹「國峰厝好貸」作為民間二胎房貸的選項。分析其優缺點,包括不受央行禁令影響、審核快速、核准率高等優勢,以及較高的利率(7%-16%)和民間借貸的風險。作者提醒讀者,若非走投無路,應謹慎評估,並建議諮詢專業人士。
Thumbnail
COMPUTEX 2024迎來 9 大科技巨頭參與,包括 NVIDIA、Intel 、AMD等。大廠面對 AI 的發展,積極推出高效能處理器產品,並展望 AI 未來的應用潛力。而未來巢的生成式AI對話機器人GeniAuto_X也希望協助企業提升生產力與自動化工作流程,進行數位轉型,並提出應用情境。
Thumbnail
COMPUTEX 2024迎來 9 大科技巨頭參與,包括 NVIDIA、Intel 、AMD等。大廠面對 AI 的發展,積極推出高效能處理器產品,並展望 AI 未來的應用潛力。而未來巢的生成式AI對話機器人GeniAuto_X也希望協助企業提升生產力與自動化工作流程,進行數位轉型,並提出應用情境。
Thumbnail
NVIDIA的新目標:AI晶圓代工 NVIDIA宣布,他們的目標是成為支援企業開發AI應用程式的「AI晶圓代工」。這與接受客戶委託製造半導體的代工廠相似,NVIDIA將提供技術、專業知識和基礎設施,幫助實現AI應用程式。
Thumbnail
NVIDIA的新目標:AI晶圓代工 NVIDIA宣布,他們的目標是成為支援企業開發AI應用程式的「AI晶圓代工」。這與接受客戶委託製造半導體的代工廠相似,NVIDIA將提供技術、專業知識和基礎設施,幫助實現AI應用程式。
Thumbnail
NVIDIA的新目標是成為支援企業開發AI應用程式的「AI晶圓代工」,提供技術、專業知識和基礎設施,幫助實現AI應用。具體而言,NVIDIA將提供GPU、自主CPU「Grace」、超級計算機及其硬體,還有軟體和工具,以滿足客戶需求。
Thumbnail
NVIDIA的新目標是成為支援企業開發AI應用程式的「AI晶圓代工」,提供技術、專業知識和基礎設施,幫助實現AI應用。具體而言,NVIDIA將提供GPU、自主CPU「Grace」、超級計算機及其硬體,還有軟體和工具,以滿足客戶需求。
Thumbnail
NVIDIA、Intel、Tenstorrent和RISC-V在AI半導體領域的競爭和合作。Intel在AI領域推出了一系列產品,Tenstorrent和Rapidus合作開發新技術,而RISC-V開放源碼指令集架構也受到了廣泛關注。這些內容都展示了AI半導體市場的技術革新和競爭激烈的情況。
Thumbnail
NVIDIA、Intel、Tenstorrent和RISC-V在AI半導體領域的競爭和合作。Intel在AI領域推出了一系列產品,Tenstorrent和Rapidus合作開發新技術,而RISC-V開放源碼指令集架構也受到了廣泛關注。這些內容都展示了AI半導體市場的技術革新和競爭激烈的情況。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
NVIDIA在人工智慧處理專用GPU領域的地位牢固,但面臨著來自英特爾和超微半導體等競爭對手的反擊。新興企業也加入競爭,使得競爭更加激烈。未來,合作關係將變得至關重要,NVIDIA和其他競爭對手在激烈的競爭中脫穎而出的關鍵。
Thumbnail
NVIDIA在人工智慧處理專用GPU領域的地位牢固,但面臨著來自英特爾和超微半導體等競爭對手的反擊。新興企業也加入競爭,使得競爭更加激烈。未來,合作關係將變得至關重要,NVIDIA和其他競爭對手在激烈的競爭中脫穎而出的關鍵。
Thumbnail
NVIDIA的Blackwell計算平台代表著實時生成式AI應用的重大進步,旨在滿足跨行業挑戰。此平台提升了計算效能,促進了AI在實體世界的應用,並對從自動駕駛到醫療診斷等多個領域產生了深遠影響。NVIDIA 黃仁勳的願景是將AI技術從虛擬世界帶入現實,為創新開闢新道路,一個更加智慧和互聯的未來。
Thumbnail
NVIDIA的Blackwell計算平台代表著實時生成式AI應用的重大進步,旨在滿足跨行業挑戰。此平台提升了計算效能,促進了AI在實體世界的應用,並對從自動駕駛到醫療診斷等多個領域產生了深遠影響。NVIDIA 黃仁勳的願景是將AI技術從虛擬世界帶入現實,為創新開闢新道路,一個更加智慧和互聯的未來。
Thumbnail
2023年初,OpenAI 帶來生成式 AI 的實際生活應用,讓 Nvidia GPU, AI server 及 Broadcom 網路交換器供不應求,為了打造既便利又有效率的生活,全球都在追逐這一場新的契機。但是....
Thumbnail
2023年初,OpenAI 帶來生成式 AI 的實際生活應用,讓 Nvidia GPU, AI server 及 Broadcom 網路交換器供不應求,為了打造既便利又有效率的生活,全球都在追逐這一場新的契機。但是....
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News