NVIDIA Llama Nemotron系列:開源AI推理新突破,效能超越DeepSeek-R1

更新 發佈閱讀 6 分鐘

NVIDIA前陣子推出了Llama-Nemotron系列,這是一組專為高效AI推理和代理工作流程設計的開源推理模型。本文將討論Llama-Nemotron系列的發布、開源特性,以及其與DeepSeek-R1的效能比較。

raw-image

Llama-3.1-Nemotron-Ultra-253B-v1


NVIDIA Llama-Nemotron系列:三款模型滿足多元需求

NVIDIA於2025年5月正式發布Llama-Nemotron系列,包含三款模型,針對不同應用場景進行最佳化:

  1. Nano (8B參數):適合個人電腦和邊緣設備,輕量高效,適用於資源受限環境。
  2. Super (49B參數):針對單GPU設定,提供卓越的性能與靈活性。
  3. Ultra (253B參數):專為多GPU伺服器設計,支援高達128K token的上下文長度,適用於複雜的企業級應用。

這些模型基於Meta的Llama-3.1-405B-Instruct架構,經過NVIDIA的後訓練最佳化,顯著提升了在推理、數學、程式設計和決策制定等方面的表現。尤其是Llama-3.1-Nemotron-Ultra-253B-v1,在多項基準測試中與DeepSeek-R1等頂尖模型競爭,展現了其高效能與高效率的優勢。

此外,NVIDIA於在arXiv發布了詳細的技術報告,涵蓋監督微調(SFT)、大規模強化學習(RL)及模型評估細節。報告還公開了訓練數據,包括NVIDIA Llama Nemotron Post-Training Dataset和OpenCodeReasoning Dataset,為開發者提供了高度透明的資源。

arXiv:Llama-Nemotron: Efficient Reasoning Models


Llama-Nemotron的開源透明

模型權重開放

Llama-Nemotron系列的模型權重(Nano 8B、Super 49B、Ultra 253B)以Apache 2.0許可證發布,開發者可透過Hugging Face等平台自由下載、使用、修改和部署,為AI社群提供了低門檻的創新機會。

訓練數據公開

NVIDIA不僅公開模型權重,還釋出了大量訓練數據,包括後訓練數據集和程式推理數據集。這些數據集包含合成數據和人工標註數據,專為推理、數學和程式設計任務設計。這種透明度在高性能模型中極為罕見,進一步推動了AI研究的民主化。

訓練框架與工具

NVIDIA提供了開源的NeMo框架,用於訓練Llama-Nemotron模型,並附有詳細的訓練流程、神經架構搜尋(NAS)和後訓練技術文檔,此外,NVIDIA的NIM微服務和評估基準也向公眾開放,提升了模型的實用性。

raw-image

Llama-3.1-Nemotron-Ultra-253B-v1


Llama-Nemotron vs. DeepSeek-R1

整體競爭力與排名

根據獨立評測機構Artificial Analysis的2025年4月數據,Llama-3.1-Nemotron-Ultra-253B(LN-Ultra)以61分的成績,略高於DeepSeek-R1的60分,成為最「智慧」的開源模型。這顯示LN-Ultra在推理能力上已達到業界領先水平。

推理效率

LN-Ultra在推理效率上展現了顯著優勢。透過Puzzle架構(神經架構搜尋)和FFN Fusion技術,LN-Ultra能在單一8xH100節點上高效運行,而DeepSeek-R1則需8xH200節點。在GPQA-Diamond基準測試中,LN-Ultra的吞吐量比DeepSeek-R1高出1.71倍,推理延遲顯著改善。

推理能力

LN-Ultra在GPQA-Diamond基準測試中達到76.0%的準確度,超越DeepSeek-R1的71.5%,創下開源模型的新紀錄。透過大規模強化學習,LN-Ultra在推理任務中甚至超越其教師模型DeepSeek-R1。此外,在JudgeBench等超分佈任務上,LN-Ultra也表現出色,穩坐最佳開源模型寶座。

其他基準測試

LN-Ultra在AIME24、AIME25、MATH500和LiveCodeBench等推理基準測試中,表現與DeepSeek-R1相當或更佳。即使在非推理任務(如BFCL V2 Live和IFEval),LN-Ultra也保持與頂尖模型的競爭力。


NVIDIA的Llama-Nemotron系列在推理能力和效率上超越DeepSeek-R1,說明最強開源模型的良性競爭仍在持續中,也能造福更多AI研究等領域。
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~

也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!

>>>請我喝一杯咖啡

留言
avatar-img
留言分享你的想法!
avatar-img
TN科技筆記(TechNotes)的沙龍
63會員
202內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/05/09
Mistral AI於2025年5月7日推出 Mistral Medium 3,以高效能、低成本和企業級應用為核心,挑戰市場上的頂尖模型。這款模型不僅在效能上媲美Anthropic的Claude Sonnet 3.7,更以低至8倍的成本優勢,成為企業數位轉型的理想選擇。
Thumbnail
2025/05/09
Mistral AI於2025年5月7日推出 Mistral Medium 3,以高效能、低成本和企業級應用為核心,挑戰市場上的頂尖模型。這款模型不僅在效能上媲美Anthropic的Claude Sonnet 3.7,更以低至8倍的成本優勢,成為企業數位轉型的理想選擇。
Thumbnail
2025/05/07
Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06,似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的編碼能力、前端網頁開發表現,以及多模態應用的突破,成為最新的AI焦點。
Thumbnail
2025/05/07
Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06,似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的編碼能力、前端網頁開發表現,以及多模態應用的突破,成為最新的AI焦點。
Thumbnail
2025/05/04
2025 年 5 月,Suno 推出 V4.5 版本帶來更強大的功能。然而,隨著 Suno 和其他 AI 音樂生成服務的崛起,AI 音樂生成的版權爭議也日益浮出水面。本文將介紹 Suno V4.5 的更新特色、比較其他知名 AI 音樂生成服務,並探討 AI 音樂的版權問題。
Thumbnail
2025/05/04
2025 年 5 月,Suno 推出 V4.5 版本帶來更強大的功能。然而,隨著 Suno 和其他 AI 音樂生成服務的崛起,AI 音樂生成的版權爭議也日益浮出水面。本文將介紹 Suno V4.5 的更新特色、比較其他知名 AI 音樂生成服務,並探討 AI 音樂的版權問題。
Thumbnail
看更多
你可能也想看
Thumbnail
厭倦了管理眾多信用卡以追求最高回饋?玉山Unicard權益切換信用卡應運而生,讓您輕鬆切換消費方案,從1%無上限基本回饋,透過三種方案任意切換,最高可享4.5%回饋,更有限時核卡加碼至7.5%。本文深入解析各方案優勢、設定方式,並提供日常與旅行配置建議,讓您成為聰明消費的「回饋金獵人」。
Thumbnail
厭倦了管理眾多信用卡以追求最高回饋?玉山Unicard權益切換信用卡應運而生,讓您輕鬆切換消費方案,從1%無上限基本回饋,透過三種方案任意切換,最高可享4.5%回饋,更有限時核卡加碼至7.5%。本文深入解析各方案優勢、設定方式,並提供日常與旅行配置建議,讓您成為聰明消費的「回饋金獵人」。
Thumbnail
話說身為短線交易者,每天要作的事情就是從盤勢觀察、到籌碼流向,再到經過多維度資料數據交叉比對,盤中盯著分K、江波圖和五檔報價,算計著每一分K線的轉折,雖能換來即時驗證判斷的快感與成就,但長期下來,卻也衍生眼睛與肩頸卻成了抹不去的職業病。
Thumbnail
話說身為短線交易者,每天要作的事情就是從盤勢觀察、到籌碼流向,再到經過多維度資料數據交叉比對,盤中盯著分K、江波圖和五檔報價,算計著每一分K線的轉折,雖能換來即時驗證判斷的快感與成就,但長期下來,卻也衍生眼睛與肩頸卻成了抹不去的職業病。
Thumbnail
快要年末了,對於即將要出國的我,即時來了這張信用卡真的很不錯。認識我的人都知道我因為工作常常要出國,所以這次感謝玉山銀行合作邀請,讓我可以體驗這張卡的美好。
Thumbnail
快要年末了,對於即將要出國的我,即時來了這張信用卡真的很不錯。認識我的人都知道我因為工作常常要出國,所以這次感謝玉山銀行合作邀請,讓我可以體驗這張卡的美好。
Thumbnail
COMPUTEX 2024迎來 9 大科技巨頭參與,包括 NVIDIA、Intel 、AMD等。大廠面對 AI 的發展,積極推出高效能處理器產品,並展望 AI 未來的應用潛力。而未來巢的生成式AI對話機器人GeniAuto_X也希望協助企業提升生產力與自動化工作流程,進行數位轉型,並提出應用情境。
Thumbnail
COMPUTEX 2024迎來 9 大科技巨頭參與,包括 NVIDIA、Intel 、AMD等。大廠面對 AI 的發展,積極推出高效能處理器產品,並展望 AI 未來的應用潛力。而未來巢的生成式AI對話機器人GeniAuto_X也希望協助企業提升生產力與自動化工作流程,進行數位轉型,並提出應用情境。
Thumbnail
NVIDIA的新目標:AI晶圓代工 NVIDIA宣布,他們的目標是成為支援企業開發AI應用程式的「AI晶圓代工」。這與接受客戶委託製造半導體的代工廠相似,NVIDIA將提供技術、專業知識和基礎設施,幫助實現AI應用程式。
Thumbnail
NVIDIA的新目標:AI晶圓代工 NVIDIA宣布,他們的目標是成為支援企業開發AI應用程式的「AI晶圓代工」。這與接受客戶委託製造半導體的代工廠相似,NVIDIA將提供技術、專業知識和基礎設施,幫助實現AI應用程式。
Thumbnail
NVIDIA的新目標是成為支援企業開發AI應用程式的「AI晶圓代工」,提供技術、專業知識和基礎設施,幫助實現AI應用。具體而言,NVIDIA將提供GPU、自主CPU「Grace」、超級計算機及其硬體,還有軟體和工具,以滿足客戶需求。
Thumbnail
NVIDIA的新目標是成為支援企業開發AI應用程式的「AI晶圓代工」,提供技術、專業知識和基礎設施,幫助實現AI應用。具體而言,NVIDIA將提供GPU、自主CPU「Grace」、超級計算機及其硬體,還有軟體和工具,以滿足客戶需求。
Thumbnail
NVIDIA、Intel、Tenstorrent和RISC-V在AI半導體領域的競爭和合作。Intel在AI領域推出了一系列產品,Tenstorrent和Rapidus合作開發新技術,而RISC-V開放源碼指令集架構也受到了廣泛關注。這些內容都展示了AI半導體市場的技術革新和競爭激烈的情況。
Thumbnail
NVIDIA、Intel、Tenstorrent和RISC-V在AI半導體領域的競爭和合作。Intel在AI領域推出了一系列產品,Tenstorrent和Rapidus合作開發新技術,而RISC-V開放源碼指令集架構也受到了廣泛關注。這些內容都展示了AI半導體市場的技術革新和競爭激烈的情況。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
NVIDIA在人工智慧處理專用GPU領域的地位牢固,但面臨著來自英特爾和超微半導體等競爭對手的反擊。新興企業也加入競爭,使得競爭更加激烈。未來,合作關係將變得至關重要,NVIDIA和其他競爭對手在激烈的競爭中脫穎而出的關鍵。
Thumbnail
NVIDIA在人工智慧處理專用GPU領域的地位牢固,但面臨著來自英特爾和超微半導體等競爭對手的反擊。新興企業也加入競爭,使得競爭更加激烈。未來,合作關係將變得至關重要,NVIDIA和其他競爭對手在激烈的競爭中脫穎而出的關鍵。
Thumbnail
NVIDIA的Blackwell計算平台代表著實時生成式AI應用的重大進步,旨在滿足跨行業挑戰。此平台提升了計算效能,促進了AI在實體世界的應用,並對從自動駕駛到醫療診斷等多個領域產生了深遠影響。NVIDIA 黃仁勳的願景是將AI技術從虛擬世界帶入現實,為創新開闢新道路,一個更加智慧和互聯的未來。
Thumbnail
NVIDIA的Blackwell計算平台代表著實時生成式AI應用的重大進步,旨在滿足跨行業挑戰。此平台提升了計算效能,促進了AI在實體世界的應用,並對從自動駕駛到醫療診斷等多個領域產生了深遠影響。NVIDIA 黃仁勳的願景是將AI技術從虛擬世界帶入現實,為創新開闢新道路,一個更加智慧和互聯的未來。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News