方格子 vocus

NVIDIA Llama Nemotron系列：開源AI推理新突破，效能超越DeepSeek-R1

TN科技筆記(TechNotes)

發佈於科技領域筆記

2025/05/10 更新2025/05/10 發佈閱讀 6 分鐘

NVIDIA前陣子推出了Llama-Nemotron系列，這是一組專為高效AI推理和代理工作流程設計的開源推理模型。本文將討論Llama-Nemotron系列的發布、開源特性，以及其與DeepSeek-R1的效能比較。

Llama-3.1-Nemotron-Ultra-253B-v1

NVIDIA Llama-Nemotron系列：三款模型滿足多元需求

NVIDIA於2025年5月正式發布Llama-Nemotron系列，包含三款模型，針對不同應用場景進行最佳化：

Nano (8B參數)：適合個人電腦和邊緣設備，輕量高效，適用於資源受限環境。
Super (49B參數)：針對單GPU設定，提供卓越的性能與靈活性。
Ultra (253B參數)：專為多GPU伺服器設計，支援高達128K token的上下文長度，適用於複雜的企業級應用。

這些模型基於Meta的Llama-3.1-405B-Instruct架構，經過NVIDIA的後訓練最佳化，顯著提升了在推理、數學、程式設計和決策制定等方面的表現。尤其是Llama-3.1-Nemotron-Ultra-253B-v1，在多項基準測試中與DeepSeek-R1等頂尖模型競爭，展現了其高效能與高效率的優勢。

此外，NVIDIA於在arXiv發布了詳細的技術報告，涵蓋監督微調（SFT）、大規模強化學習（RL）及模型評估細節。報告還公開了訓練數據，包括NVIDIA Llama Nemotron Post-Training Dataset和OpenCodeReasoning Dataset，為開發者提供了高度透明的資源。

arXiv：Llama-Nemotron: Efficient Reasoning Models

Llama-Nemotron的開源透明

模型權重開放

Llama-Nemotron系列的模型權重（Nano 8B、Super 49B、Ultra 253B）以Apache 2.0許可證發布，開發者可透過Hugging Face等平台自由下載、使用、修改和部署，為AI社群提供了低門檻的創新機會。

訓練數據公開

NVIDIA不僅公開模型權重，還釋出了大量訓練數據，包括後訓練數據集和程式推理數據集。這些數據集包含合成數據和人工標註數據，專為推理、數學和程式設計任務設計。這種透明度在高性能模型中極為罕見，進一步推動了AI研究的民主化。

訓練框架與工具

NVIDIA提供了開源的NeMo框架，用於訓練Llama-Nemotron模型，並附有詳細的訓練流程、神經架構搜尋（NAS）和後訓練技術文檔，此外，NVIDIA的NIM微服務和評估基準也向公眾開放，提升了模型的實用性。

Llama-3.1-Nemotron-Ultra-253B-v1

Llama-Nemotron vs. DeepSeek-R1

整體競爭力與排名

根據獨立評測機構Artificial Analysis的2025年4月數據，Llama-3.1-Nemotron-Ultra-253B（LN-Ultra）以61分的成績，略高於DeepSeek-R1的60分，成為最「智慧」的開源模型。這顯示LN-Ultra在推理能力上已達到業界領先水平。

推理效率

LN-Ultra在推理效率上展現了顯著優勢。透過Puzzle架構（神經架構搜尋）和FFN Fusion技術，LN-Ultra能在單一8xH100節點上高效運行，而DeepSeek-R1則需8xH200節點。在GPQA-Diamond基準測試中，LN-Ultra的吞吐量比DeepSeek-R1高出1.71倍，推理延遲顯著改善。

推理能力

LN-Ultra在GPQA-Diamond基準測試中達到76.0%的準確度，超越DeepSeek-R1的71.5%，創下開源模型的新紀錄。透過大規模強化學習，LN-Ultra在推理任務中甚至超越其教師模型DeepSeek-R1。此外，在JudgeBench等超分佈任務上，LN-Ultra也表現出色，穩坐最佳開源模型寶座。

其他基準測試

LN-Ultra在AIME24、AIME25、MATH500和LiveCodeBench等推理基準測試中，表現與DeepSeek-R1相當或更佳。即使在非推理任務（如BFCL V2 Live和IFEval），LN-Ultra也保持與頂尖模型的競爭力。

NVIDIA的Llama-Nemotron系列在推理能力和效率上超越DeepSeek-R1，說明最強開源模型的良性競爭仍在持續中，也能造福更多AI研究等領域。
我是TN科技筆記，如果喜歡這篇文章，歡迎留言、點選愛心、轉發給我支持鼓勵～

也歡迎每個月請我喝杯咖啡，鼓勵我撰寫更多科技文章，一起跟著科技浪潮前進！！

TN科技筆記(TechNotes)的沙龍科技領域筆記

留言

TN科技筆記(TechNotes)的沙龍

70會員

228內容數

大家好，我是TN，喜歡分享科技領域相關資訊，希望各位不吝支持與交流！

TN科技筆記(TechNotes)的沙龍的其他內容

2025/05/09

Mistral Medium 3 更新介紹：高CP值的企業AI新選擇

Mistral AI於2025年5月7日推出 Mistral Medium 3，以高效能、低成本和企業級應用為核心，挑戰市場上的頂尖模型。這款模型不僅在效能上媲美Anthropic的Claude Sonnet 3.7，更以低至8倍的成本優勢，成為企業數位轉型的理想選擇。

2025/05/09

Mistral Medium 3 更新介紹：高CP值的企業AI新選擇

2025/05/07

Gemini 2.5 Pro Preview 05-06 更新介紹：前端開發與多模態應用的領頭羊

Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06，似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的編碼能力、前端網頁開發表現，以及多模態應用的突破，成為最新的AI焦點。

2025/05/07

Gemini 2.5 Pro Preview 05-06 更新介紹：前端開發與多模態應用的領頭羊

2025/05/04

Suno V4.5 全新升級：更強大的 AI 音樂生成與版權爭議解析

2025 年 5 月，Suno 推出 V4.5 版本帶來更強大的功能。然而，隨著 Suno 和其他 AI 音樂生成服務的崛起，AI 音樂生成的版權爭議也日益浮出水面。本文將介紹 Suno V4.5 的更新特色、比較其他知名 AI 音樂生成服務，並探討 AI 音樂的版權問題。

2025/05/04

Suno V4.5 全新升級：更強大的 AI 音樂生成與版權爭議解析

#AI 的其他內容

AI 特助開聘：Notion 工作空間，終於有自動做事的 AI 員工了｜Notion Custom Agents

金融人類學徒

AI 浪潮下的「毀滅性創新」：解析湯森路透、納斯達克股價重挫的關鍵

與老查一起讀商業好書

當部屬用 AI 一小時完成你三天的工作量，主管如何重塑領導力？運用「情境領導」重新定義 AI 協作時代的管理

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品，以十段寓言式殘篇，重新拼貼記憶、暴力與美學，並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇：帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略，嘗試解析極權底下不可言說之事，將如何成為可被觀看的公共發聲。

#釀電影#釀評論#藝術評論

2026/01/14

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

#釀電影#釀評論#藝術評論

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

柏林劇團在 2026 北藝嚴選，再次帶來由布萊希特改編的經典劇目《三便士歌劇》（The Threepenny Opera），導演巴里・柯斯基以舞台結構與舞台調度，重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核，藉由沉浸與疏離的辯證，解析此作如何再次照見觀眾自身的位置。

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲．蓋柏樂》的詮釋，從劇本歷史、聲響與舞臺設計，到演員的主體創作方法，探討此版本如何讓經典劇作在當代劇場語境下煥發新生，滿足現代觀眾的觀看慾望。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

《轉轉生》為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，融合舞蹈、音樂、時尚和視覺藝術，透過身體、服裝與群舞結構，回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發，分析《轉轉生》如何以當代目光，形塑去殖民視角的奈及利亞歷史。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14