DeepSeek-V3.2 解析:專注效率與推理,開源模型追趕閉源模型的野心之作

更新 發佈閱讀 9 分鐘

DeepSeek AI 於2025年12月1日發布了最新的模型:DeepSeek-V3.2。它試圖證明,透過架構革新、高效的訓練方法與策略性的數據工程,開源模型不僅能追趕,甚至有機會在特定領域與頂尖閉源模型一較高下。

DeepSeek-V3.2: Efficient Reasoning & Agentic AI

raw-image

為何開源模型總是追不上?DeepSeek 看到的三大痛點

在提出解決方案前,必須先精準地定義問題。DeepSeek 團隊明確指出了阻礙開源模型發展的三大根本性缺陷,這些觀察可謂一針見血。

架構效率瓶頸:注意力機制的計算詛咒

大型語言模型的核心是「注意力機制」(Attention Mechanism),它讓模型在處理文字時,能判斷哪些詞彙最為關鍵。然而,傳統的「全局注意力」(Vanilla Attention) 機制存在一個致命缺陷:其計算複雜度會隨著輸入序列長度的平方增加。簡單來說,當你處理的文章長度增加一倍,計算成本會變成四倍。這使得模型在處理長篇報告、程式碼庫或進行多輪複雜對話時,變得極其昂貴且緩慢,成為了擴展與部署的巨大障礙。

資源投入不足:後訓練階段的巨大鴻溝

模型的「預訓練」(Pre-training) 就像是為其灌輸了通識教育,讓它具備廣泛的知識。但要讓模型從「博學」走向「專精」,能解決數學、寫程式碼等複雜任務,則需要投入大量的「後訓練」(Post-training)。這個階段需要高品質的數據和龐大的算力進行強化學習 (RL) 與微調。過去,開源社群普遍在此階段的算力投資不足,導致模型雖然知識淵博,卻缺乏解決高難度問題的「技巧」與「紀律」。

AI 代理人能力落後:從「會說」到「會做」的最後一哩路

未來的 AI 不僅僅是個聊天機器人,更要能化身為「AI 代理人」(AI Agent),能理解複雜指令、使用外部工具 (如搜尋引擎、計算機、API) 來完成多步驟的複雜任務。這要求模型具備強大的泛化與指令遵循能力。然而,相較於頂級閉源模型,開源模型在此領域表現明顯滯後,限制了它們在真實世界應用場景中的可靠性與實用性。

DeepSeek-V3.2 的三叉戟:架構、訓練與數據的全面革新

針對上述三大痛點,DeepSeek-V3.2 提出了三大核心技術突破,如同三叉戟般,精準地刺向問題的核心。

突破一:用「稀疏」取代「暴力」的 DSA 架構

為了解決全局注意力的效率詛咒,DeepSeek-V3.2 引入了創新的 DeepSeek Sparse Attention (DSA) 架構。其核心思想非常直觀:當人類專家閱讀一份文件尋找答案時,並不會逐字逐句地通讀全文,而是會快速掃描,定位到最相關的幾個段落進行精讀。

DSA 的運作方式與此類似,它包含兩個關鍵組件:

  1. Lightning Indexer:這是一個輕量級模組,它的任務是快速掃描整個序列,為每個詞彙打上「相關性分數」,判斷它對於當前正在處理的詞彙有多重要。
  2. Fine-Grained Token Selection:根據索引器打出的分數,此機制只會挑選出分數最高的少數幾個關鍵詞彙,讓主要的注意力計算只發生在這個高度相關的小集合內。

透過這種方式,DSA 成功將注意力計算的複雜度大幅降低。無論是在處理長文本的預處理 (Prefilling) 還是生成 (Decoding) 階段,DSA 都帶來了顯著的端到端速度提升與成本下降,為後續大規模、高強度的後訓練奠定了堅實的經濟基礎。

突破二:穩定且可規模化的強化學習 (RL) 框架

有了高效的底層架構,DeepSeek 得以將超過預訓練成本 10% 的龐大算力,史無前例地投入到後訓練階段。為了確保如此大規模的強化學習過程穩定可控,他們建立了一套精密的框架。

首先,團隊採用了「專家蒸餾」(Specialist Distillation) 策略。他們先針對數學、程式、邏輯推理、代理人任務等六個特定領域,訓練出各自的「專家模型」。待這些專家達到頂尖水準後,再利用它們生成大量高品質、特定領域的數據。

接著,這些數據被用於一個統一的「混合式強化學習」階段。透過 GRPO (Group Relative Policy Optimization) 演算法,將推理、代理人能力與人類價值對齊的訓練,合併在同一個階段進行。這種做法有效地避免了在多階段訓練中常見的「災難性遺忘」問題,讓模型能同時在多個維度上均衡發展。另外論文內亦闡述了幾項更細緻的技術,以確保大規模 RL 過程中的穩定性。

突破三:大規模「AI 代理人」任務合成,打造實戰能力

為了讓模型真正學會「動手做事」,DeepSeek 開發了一套創新的兩階段數據合成流程,為模型打造了強大的代理人能力。

第一階段是「冷啟動」(Cold-Start),目標是讓模型初步理解如何在推理過程中嵌入工具的使用。團隊透過巧妙的提示工程,將現有的推理數據和非推理的代理人數據結合,教會模型如何生成包含工具執行的思考軌跡。

第二階段則是「大規模代理人任務合成」。為了讓模型具備應對千變萬化真實場景的泛化能力,團隊建立了一個龐大且多樣化的強化學習任務庫,合成了超過 1,800 個獨特的環境和 85,000 個複雜的提示。這些數據涵蓋了四大類代理人任務:

  • 搜尋代理人:橫跨多領域和語言的高品質問答對。
  • 程式碼代理人:從 GitHub 挖掘的數萬個可重現的軟體問題解決環境。
  • 程式碼解釋器代理人:涵蓋數學、邏輯和數據科學的複雜問題,需要模型操作 Jupyter Notebook 求解。
  • 通用代理人:自動合成的獨特、難以解決但易於驗證的複雜規劃任務。

透過這套合成數據,DeepSeek-V3.2 的工具使用和指令遵循能力得到了極大的提升。

實力對決:DeepSeek-V3.2 與 V3.2-Speciale 的驚人表現

在推理任務上,DeepSeek-V3.2 的表現與 GPT-5-high 相當。在 AI 代理人能力方面,它顯著超越了其他開源模型,有效地縮小了與閉源模型的差距。例如,在程式碼代理人測試 (Terminal Bench 2.0) 和工具使用測試 (Tool-Decathlon) 中,其得分都大幅領先其他開源對手,並逼近像 Claude-4.5-Sonnet 這樣的頂尖模型。

為了探索純粹推理能力的極限,團隊同時推出了一個實驗性模型 DeepSeek-V3.2-Speciale。這個模型專為推理任務進行了極致優化,在多個頂級數學和程式設計競賽中,達到了金牌水準的表現,包括 2025 年的國際數學奧林匹亞 (IMO) 和國際資訊學奧林匹亞 (IOI)。

然而,這種極致的準確性也帶來了效率上的權衡。Deepseek 坦誠地指出,儘管 Speciale 在某些測試上的準確率超越了 Gemini-3.0-Pro,但它需要生成更長的思考鏈 (更多的 Token) 才能得出答案。這凸顯了「思考效率」成為了未來需要優化的關鍵方向。

TN科技筆記的觀點

  • DSA 架構並非全新概念,但 DeepSeek 團隊將其工程化、規模化,並成功地應用在一個已經非常龐大的模型上。對於廣大希望部署開源模型的開發者和企業而言,一個性能強大且推理成本更低的基礎模型,其價值不言而喻。
  • Deepseek 團隊也承認,模型與頂尖閉源模型(如 Gemini-3.0-Pro)之間仍然存在差距,團隊直言,由於總體訓練的浮點運算次數 (FLOPs) 較少,DeepSeek-V3.2 在「世界知識的廣度」上仍然落後,他們計劃在未來透過擴大預訓練規模來解決。此外,在處理頂級複雜任務時,其表現仍然遜於前沿模型,他們也計劃持續去迭代基礎模型與後訓練的方式。這也告訴我們,追趕之路並非一蹴可幾,越是接近頂點,每一步的提升都將更加困難,這場追趕賽也將是一場資源消耗巨大的長期抗戰。

支持TN科技筆記,與科技共同前行

我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者以及新加入的讀者們,讓我更加有動力為各位帶來科技新知!

以下是我的 threads 也歡迎追蹤、回覆、轉發喔!

>>>>> TN科技筆記(TechNotes)

留言
avatar-img
留言分享你的想法!
avatar-img
TN科技筆記(TechNotes)的沙龍
59會員
193內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/11/30
解析 Google CEO Sundar Pichai 的最新訪談,了解 Gemini 3 背後不僅是模型的升級,更是 Google 長達十年的「全端 AI 戰略」成果。從 Vibe Coding 到未來登月計畫,看懂 Google 的 AI 護城河。
2025/11/30
解析 Google CEO Sundar Pichai 的最新訪談,了解 Gemini 3 背後不僅是模型的升級,更是 Google 長達十年的「全端 AI 戰略」成果。從 Vibe Coding 到未來登月計畫,看懂 Google 的 AI 護城河。
2025/11/28
前 OpenAI 首席科學家 Ilya Sutskever 在創立 SSI 後的首次深度專訪中,揭示了當前 AI 模型評測高分卻表現笨拙的根本原因。他認為 AI 的未來不在於盲目縮放,而在於解決「泛化」難題,打造能像人類一樣持續學習的「超級學習者」。
2025/11/28
前 OpenAI 首席科學家 Ilya Sutskever 在創立 SSI 後的首次深度專訪中,揭示了當前 AI 模型評測高分卻表現笨拙的根本原因。他認為 AI 的未來不在於盲目縮放,而在於解決「泛化」難題,打造能像人類一樣持續學習的「超級學習者」。
2025/11/24
Meta AI 推出新一代影像分割模型 SAM 3 與 3D 重建模型 SAM-3D。本文將深度解析其核心技術、應用場景,以及它如何透過文字指令和單張照片,改變我們與數位世界的互動方式。
Thumbnail
2025/11/24
Meta AI 推出新一代影像分割模型 SAM 3 與 3D 重建模型 SAM-3D。本文將深度解析其核心技術、應用場景,以及它如何透過文字指令和單張照片,改變我們與數位世界的互動方式。
Thumbnail
看更多
你可能也想看
Thumbnail
大家好,我是小編六爺,週一早上叫醒你的,是夢想還是帳單呢? 但你可知道:現在選在AI賽道上創業的,很可能某天忽然把你「砸」醒的,是天外飛來好幾億美金的支票? 我們來看看這則新聞 「Meta 擬斥數十億美元投資一家主導 AI 數據市場的新創公司」
Thumbnail
大家好,我是小編六爺,週一早上叫醒你的,是夢想還是帳單呢? 但你可知道:現在選在AI賽道上創業的,很可能某天忽然把你「砸」醒的,是天外飛來好幾億美金的支票? 我們來看看這則新聞 「Meta 擬斥數十億美元投資一家主導 AI 數據市場的新創公司」
Thumbnail
上篇文章《奧特曼傳》聚焦 OpenAI 如何從「讓 AI 造福人類」的理想出發,演變成資本與權力的角逐賽,奧特曼與馬斯克分道揚鑣後,OpenAI 與微軟攜手推出 ChatGPT,席捲全球;然而,真正的較量並不僅限於兩人,而是以「AI 霸主」之名,在更廣闊的戰場上展開......
Thumbnail
上篇文章《奧特曼傳》聚焦 OpenAI 如何從「讓 AI 造福人類」的理想出發,演變成資本與權力的角逐賽,奧特曼與馬斯克分道揚鑣後,OpenAI 與微軟攜手推出 ChatGPT,席捲全球;然而,真正的較量並不僅限於兩人,而是以「AI 霸主」之名,在更廣闊的戰場上展開......
Thumbnail
在AI迅速發展的當下,如何應對這場顛覆成為重要課題。萬維鋼在其著作《拐點:站在 AI 顛覆世界的前夜》中說明AI如何挑戰Google的搜尋霸主地位,並探討生成式AI的限制,以及在這個變革中個人如何利用AI提升決策能力,掌握未來的主導權。人要比AI凶!
Thumbnail
在AI迅速發展的當下,如何應對這場顛覆成為重要課題。萬維鋼在其著作《拐點:站在 AI 顛覆世界的前夜》中說明AI如何挑戰Google的搜尋霸主地位,並探討生成式AI的限制,以及在這個變革中個人如何利用AI提升決策能力,掌握未來的主導權。人要比AI凶!
Thumbnail
本篇文章探討百度在AI領域的核心戰略,包括閉源大模型的採用、AI as a Service的市場潛力以及智能體的廣泛應用。對於AI商業化,百度創辦人李彥宏強調應用的深度與效用才是關鍵。此外,百度如何在面對全球AI價格戰中,選擇不同的發展路徑和商業模式,將對未來的市場發展具有重要影響。
Thumbnail
本篇文章探討百度在AI領域的核心戰略,包括閉源大模型的採用、AI as a Service的市場潛力以及智能體的廣泛應用。對於AI商業化,百度創辦人李彥宏強調應用的深度與效用才是關鍵。此外,百度如何在面對全球AI價格戰中,選擇不同的發展路徑和商業模式,將對未來的市場發展具有重要影響。
Thumbnail
曾經是中國互聯網巨頭 BAT 市值第一、中國最大搜尋引擎的百度,如今市值卻跌至其他兩間公司的不到十分之一。近年來,百度加大對 AI(文心一言、阿波羅)和自駕車技術(蘿蔔快跑)的投入,積極轉型為「AI 公司」。面對阿里巴巴和騰訊等強大對手的挑戰,百度如何在 AI 時代重新站穩腳跟,甚至逆勢崛起?
Thumbnail
曾經是中國互聯網巨頭 BAT 市值第一、中國最大搜尋引擎的百度,如今市值卻跌至其他兩間公司的不到十分之一。近年來,百度加大對 AI(文心一言、阿波羅)和自駕車技術(蘿蔔快跑)的投入,積極轉型為「AI 公司」。面對阿里巴巴和騰訊等強大對手的挑戰,百度如何在 AI 時代重新站穩腳跟,甚至逆勢崛起?
Thumbnail
這次的內容,我將分享在政大聽完 OpenAI 的執行長技術顧問(Technical Advisor to the CEO) Dr. Mohammad Bavarian 在台灣的第一場演講,透過 OpenAI 官方的視角,探討人工通用智慧(AGI)的關鍵技術和未來趨勢。
Thumbnail
這次的內容,我將分享在政大聽完 OpenAI 的執行長技術顧問(Technical Advisor to the CEO) Dr. Mohammad Bavarian 在台灣的第一場演講,透過 OpenAI 官方的視角,探討人工通用智慧(AGI)的關鍵技術和未來趨勢。
Thumbnail
上禮拜有人問我:「你做《怪獸科技公司》是想讓大家知道科技變化很快,必須了解到這些應用以及如何因應,不過我們文組也早就知道 ChatGPT、Midjourney 這類 AI 了,你到底想要告訴我們什麼?」
Thumbnail
上禮拜有人問我:「你做《怪獸科技公司》是想讓大家知道科技變化很快,必須了解到這些應用以及如何因應,不過我們文組也早就知道 ChatGPT、Midjourney 這類 AI 了,你到底想要告訴我們什麼?」
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News