vocus logo

方格子 vocus

NVIDIA Llama Nemotron系列:開源AI推理新突破,效能超越DeepSeek-R1

更新 發佈閱讀 6 分鐘

NVIDIA前陣子推出了Llama-Nemotron系列,這是一組專為高效AI推理和代理工作流程設計的開源推理模型。本文將討論Llama-Nemotron系列的發布、開源特性,以及其與DeepSeek-R1的效能比較。

raw-image

Llama-3.1-Nemotron-Ultra-253B-v1


NVIDIA Llama-Nemotron系列:三款模型滿足多元需求

NVIDIA於2025年5月正式發布Llama-Nemotron系列,包含三款模型,針對不同應用場景進行最佳化:

  1. Nano (8B參數):適合個人電腦和邊緣設備,輕量高效,適用於資源受限環境。
  2. Super (49B參數):針對單GPU設定,提供卓越的性能與靈活性。
  3. Ultra (253B參數):專為多GPU伺服器設計,支援高達128K token的上下文長度,適用於複雜的企業級應用。

這些模型基於Meta的Llama-3.1-405B-Instruct架構,經過NVIDIA的後訓練最佳化,顯著提升了在推理、數學、程式設計和決策制定等方面的表現。尤其是Llama-3.1-Nemotron-Ultra-253B-v1,在多項基準測試中與DeepSeek-R1等頂尖模型競爭,展現了其高效能與高效率的優勢。

此外,NVIDIA於在arXiv發布了詳細的技術報告,涵蓋監督微調(SFT)、大規模強化學習(RL)及模型評估細節。報告還公開了訓練數據,包括NVIDIA Llama Nemotron Post-Training Dataset和OpenCodeReasoning Dataset,為開發者提供了高度透明的資源。

arXiv:Llama-Nemotron: Efficient Reasoning Models


Llama-Nemotron的開源透明

模型權重開放

Llama-Nemotron系列的模型權重(Nano 8B、Super 49B、Ultra 253B)以Apache 2.0許可證發布,開發者可透過Hugging Face等平台自由下載、使用、修改和部署,為AI社群提供了低門檻的創新機會。

訓練數據公開

NVIDIA不僅公開模型權重,還釋出了大量訓練數據,包括後訓練數據集和程式推理數據集。這些數據集包含合成數據和人工標註數據,專為推理、數學和程式設計任務設計。這種透明度在高性能模型中極為罕見,進一步推動了AI研究的民主化。

訓練框架與工具

NVIDIA提供了開源的NeMo框架,用於訓練Llama-Nemotron模型,並附有詳細的訓練流程、神經架構搜尋(NAS)和後訓練技術文檔,此外,NVIDIA的NIM微服務和評估基準也向公眾開放,提升了模型的實用性。

raw-image

Llama-3.1-Nemotron-Ultra-253B-v1


Llama-Nemotron vs. DeepSeek-R1

整體競爭力與排名

根據獨立評測機構Artificial Analysis的2025年4月數據,Llama-3.1-Nemotron-Ultra-253B(LN-Ultra)以61分的成績,略高於DeepSeek-R1的60分,成為最「智慧」的開源模型。這顯示LN-Ultra在推理能力上已達到業界領先水平。

推理效率

LN-Ultra在推理效率上展現了顯著優勢。透過Puzzle架構(神經架構搜尋)和FFN Fusion技術,LN-Ultra能在單一8xH100節點上高效運行,而DeepSeek-R1則需8xH200節點。在GPQA-Diamond基準測試中,LN-Ultra的吞吐量比DeepSeek-R1高出1.71倍,推理延遲顯著改善。

推理能力

LN-Ultra在GPQA-Diamond基準測試中達到76.0%的準確度,超越DeepSeek-R1的71.5%,創下開源模型的新紀錄。透過大規模強化學習,LN-Ultra在推理任務中甚至超越其教師模型DeepSeek-R1。此外,在JudgeBench等超分佈任務上,LN-Ultra也表現出色,穩坐最佳開源模型寶座。

其他基準測試

LN-Ultra在AIME24、AIME25、MATH500和LiveCodeBench等推理基準測試中,表現與DeepSeek-R1相當或更佳。即使在非推理任務(如BFCL V2 Live和IFEval),LN-Ultra也保持與頂尖模型的競爭力。


NVIDIA的Llama-Nemotron系列在推理能力和效率上超越DeepSeek-R1,說明最強開源模型的良性競爭仍在持續中,也能造福更多AI研究等領域。
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~

也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!

>>>請我喝一杯咖啡

留言
avatar-img
TN科技筆記(TechNotes)的沙龍
70會員
228內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/05/09
Mistral AI於2025年5月7日推出 Mistral Medium 3,以高效能、低成本和企業級應用為核心,挑戰市場上的頂尖模型。這款模型不僅在效能上媲美Anthropic的Claude Sonnet 3.7,更以低至8倍的成本優勢,成為企業數位轉型的理想選擇。
Thumbnail
2025/05/09
Mistral AI於2025年5月7日推出 Mistral Medium 3,以高效能、低成本和企業級應用為核心,挑戰市場上的頂尖模型。這款模型不僅在效能上媲美Anthropic的Claude Sonnet 3.7,更以低至8倍的成本優勢,成為企業數位轉型的理想選擇。
Thumbnail
2025/05/07
Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06,似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的編碼能力、前端網頁開發表現,以及多模態應用的突破,成為最新的AI焦點。
Thumbnail
2025/05/07
Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06,似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的編碼能力、前端網頁開發表現,以及多模態應用的突破,成為最新的AI焦點。
Thumbnail
2025/05/04
2025 年 5 月,Suno 推出 V4.5 版本帶來更強大的功能。然而,隨著 Suno 和其他 AI 音樂生成服務的崛起,AI 音樂生成的版權爭議也日益浮出水面。本文將介紹 Suno V4.5 的更新特色、比較其他知名 AI 音樂生成服務,並探討 AI 音樂的版權問題。
Thumbnail
2025/05/04
2025 年 5 月,Suno 推出 V4.5 版本帶來更強大的功能。然而,隨著 Suno 和其他 AI 音樂生成服務的崛起,AI 音樂生成的版權爭議也日益浮出水面。本文將介紹 Suno V4.5 的更新特色、比較其他知名 AI 音樂生成服務,並探討 AI 音樂的版權問題。
Thumbnail
看更多
你可能也想看
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
COMPUTEX 2024迎來 9 大科技巨頭參與,包括 NVIDIA、Intel 、AMD等。大廠面對 AI 的發展,積極推出高效能處理器產品,並展望 AI 未來的應用潛力。而未來巢的生成式AI對話機器人GeniAuto_X也希望協助企業提升生產力與自動化工作流程,進行數位轉型,並提出應用情境。
Thumbnail
COMPUTEX 2024迎來 9 大科技巨頭參與,包括 NVIDIA、Intel 、AMD等。大廠面對 AI 的發展,積極推出高效能處理器產品,並展望 AI 未來的應用潛力。而未來巢的生成式AI對話機器人GeniAuto_X也希望協助企業提升生產力與自動化工作流程,進行數位轉型,並提出應用情境。
Thumbnail
NVIDIA的新目標:AI晶圓代工 NVIDIA宣布,他們的目標是成為支援企業開發AI應用程式的「AI晶圓代工」。這與接受客戶委託製造半導體的代工廠相似,NVIDIA將提供技術、專業知識和基礎設施,幫助實現AI應用程式。
Thumbnail
NVIDIA的新目標:AI晶圓代工 NVIDIA宣布,他們的目標是成為支援企業開發AI應用程式的「AI晶圓代工」。這與接受客戶委託製造半導體的代工廠相似,NVIDIA將提供技術、專業知識和基礎設施,幫助實現AI應用程式。
Thumbnail
NVIDIA的新目標是成為支援企業開發AI應用程式的「AI晶圓代工」,提供技術、專業知識和基礎設施,幫助實現AI應用。具體而言,NVIDIA將提供GPU、自主CPU「Grace」、超級計算機及其硬體,還有軟體和工具,以滿足客戶需求。
Thumbnail
NVIDIA的新目標是成為支援企業開發AI應用程式的「AI晶圓代工」,提供技術、專業知識和基礎設施,幫助實現AI應用。具體而言,NVIDIA將提供GPU、自主CPU「Grace」、超級計算機及其硬體,還有軟體和工具,以滿足客戶需求。
Thumbnail
NVIDIA、Intel、Tenstorrent和RISC-V在AI半導體領域的競爭和合作。Intel在AI領域推出了一系列產品,Tenstorrent和Rapidus合作開發新技術,而RISC-V開放源碼指令集架構也受到了廣泛關注。這些內容都展示了AI半導體市場的技術革新和競爭激烈的情況。
Thumbnail
NVIDIA、Intel、Tenstorrent和RISC-V在AI半導體領域的競爭和合作。Intel在AI領域推出了一系列產品,Tenstorrent和Rapidus合作開發新技術,而RISC-V開放源碼指令集架構也受到了廣泛關注。這些內容都展示了AI半導體市場的技術革新和競爭激烈的情況。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
NVIDIA在人工智慧處理專用GPU領域的地位牢固,但面臨著來自英特爾和超微半導體等競爭對手的反擊。新興企業也加入競爭,使得競爭更加激烈。未來,合作關係將變得至關重要,NVIDIA和其他競爭對手在激烈的競爭中脫穎而出的關鍵。
Thumbnail
NVIDIA在人工智慧處理專用GPU領域的地位牢固,但面臨著來自英特爾和超微半導體等競爭對手的反擊。新興企業也加入競爭,使得競爭更加激烈。未來,合作關係將變得至關重要,NVIDIA和其他競爭對手在激烈的競爭中脫穎而出的關鍵。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News