DeepSeek-V3-0324悄悄發布:特色與性能一次解析

更新於 發佈於 閱讀時間約 3 分鐘


中國AI公司DeepSeek於2025年3月24日推出了最新的開源模型 DeepSeek-V3-0324。這款模型在非推理任務(如程式設計和語言處理)上的卓越表現,讓它迅速成為焦點。作為DeepSeek V3(2024年12月發布)的升級版,DeepSeek-V3-0324不僅保留了前代的大規模參數優勢,還透過高效的技術架構與低成本特性,與OpenAI、Anthropic和Google等巨頭的頂尖模型展開競爭。


一、DeepSeek-V3-0324的主要特色

1. 參數規模與高效架構

DeepSeek-V3-0324擁有總計6710億參數,加上Multi-Token Prediction(MTP)模組的140億參數,總規模高達6850億參數。然而,透過其混合專家模型(MoE)架構,每個標記僅啟動370億參數,這種設計大幅降低了運算成本,同時保持高效能。這種高效性使其在生成速度和資源需求之間取得了平衡。

2. 超長上下文窗口

該模型支援高達128K Token的上下文窗口,使其非常適合處理長篇內容,例如技術文件撰寫或大型程式碼生成。這一特性讓它在需要大量上下文理解的應用場景中脫穎而出。

3. 易用性與低成本

DeepSeek-V3-0324以MIT許可在Hugging Face上開源,其4位元量化版本將模型大小壓縮至352GB,可在高階消費級硬體(如配備M3 Ultra晶片的Mac Studio)上以每秒超過20 Token的速度運行。這讓中小型企業和個人開發者也能輕鬆部署這款強大模型。


二、DeepSeek-V3-0324性能比較:

1. 與前代DeepSeek V3比較

相較於2024年12月推出的DeepSeek V3,DeepSeek-V3-0324在多項基準測試中顯著進步:

  • MMLU-Pro:從75.9提升至81.2(+5.3分),展現更強的知識與解題能力。
  • GPQA:從59.1躍升至68.4(+9.3分),在專業問答領域表現更出色。
  • AIME:從39.6激增至59.4(+19.8分),數學解題能力大幅提升。
  • LiveCodeBench:從39.2提高至49.2(+10分),程式設計能力更上一層樓。

2. 與閉源非推理模型比較

Claude 3.7 Sonnet(Anthropic):DeepSeek所提供與Claude-Sonnet-3.7 (Anthropic)、GPT-4.5(OpenAI)及Qwen-MAX(阿里雲)測試結果顯示如下:

raw-image

DeepSeek-V3-0324


DeepSeek-V3-0324被譽為頂尖非推理開源模型,其在程式設計、成本效益和速度上的表現令人驚艷,甚至超越部分閉源非推理模型。雖然它尚未撼動推理模型的地位,但這款模型不僅為開發者提供了強大工具,也為AI產業的未來發展注入新動能。


我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~

也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!

>>>請我喝一杯咖啡

大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
留言
avatar-img
留言分享你的想法!
NVIDIA Isaac GR00T N1是全球首個 開放的通用人形機器人基礎模型,透過 多模態學習、雙系統架構、合成數據強化和開放式開發環境,加速人形機器人的進化。本文探討GR00T N1的技術突破、合作夥伴、開發工具,以及 NVIDIA 在人形機器人未來的重要角色。
開源模型Mistral Small 3.1 於 2025 年 3 月 18 日推出,以 24 億參數實現高效能,超越 Gemma 3 等模型。其多模態功能、128,000 Token 上下文窗口與每秒 150 Token 的推理速度,使其在多項任務中表現出色,並能在消費級硬體上運行展現驚人效率。
2025年3月19日的NVIDIA GTC大會上,NVIDIA 執行長黃仁勳(Jensen Huang)發表2個多小時的主題演講,向全球展示目前 NVIDIA 在人工智慧(AI)、高效能運算與機器人領域的前瞻布局。
Gemma 3 是 Google 在 2025 年 3 月 12 日推出的最新 AI 模型,功能強大到不行!它能處理圖片和文字,還能看懂超長內容,甚至支援 140 多種語言。這篇文會跟你聊聊 Gemma 3 有多厲害!
Mistral OCR:由Mistral AI打造的全新光學字元辨識(OCR)工具 API,從頂尖的複雜文件理解能力到多語多模態支援,再到與檢索增強生成(RAG)系統的完美結合,其目標是解鎖數位化資訊的潛力。
Microsoft於2025年2月27日發布了Phi-4-multimodal,作為Phi系列的最新成員,Phi-4-multimodal以56億參數實現了文字、視覺與語音的統一處理,展現了小型語言模型(SLM)在高效能與低資源消耗間的驚人平衡。
NVIDIA Isaac GR00T N1是全球首個 開放的通用人形機器人基礎模型,透過 多模態學習、雙系統架構、合成數據強化和開放式開發環境,加速人形機器人的進化。本文探討GR00T N1的技術突破、合作夥伴、開發工具,以及 NVIDIA 在人形機器人未來的重要角色。
開源模型Mistral Small 3.1 於 2025 年 3 月 18 日推出,以 24 億參數實現高效能,超越 Gemma 3 等模型。其多模態功能、128,000 Token 上下文窗口與每秒 150 Token 的推理速度,使其在多項任務中表現出色,並能在消費級硬體上運行展現驚人效率。
2025年3月19日的NVIDIA GTC大會上,NVIDIA 執行長黃仁勳(Jensen Huang)發表2個多小時的主題演講,向全球展示目前 NVIDIA 在人工智慧(AI)、高效能運算與機器人領域的前瞻布局。
Gemma 3 是 Google 在 2025 年 3 月 12 日推出的最新 AI 模型,功能強大到不行!它能處理圖片和文字,還能看懂超長內容,甚至支援 140 多種語言。這篇文會跟你聊聊 Gemma 3 有多厲害!
Mistral OCR:由Mistral AI打造的全新光學字元辨識(OCR)工具 API,從頂尖的複雜文件理解能力到多語多模態支援,再到與檢索增強生成(RAG)系統的完美結合,其目標是解鎖數位化資訊的潛力。
Microsoft於2025年2月27日發布了Phi-4-multimodal,作為Phi系列的最新成員,Phi-4-multimodal以56億參數實現了文字、視覺與語音的統一處理,展現了小型語言模型(SLM)在高效能與低資源消耗間的驚人平衡。
本篇參與的主題活動
你有沒有發現,人生中總有幾種人讓你忍不住多看幾眼? 不是因為他們長得特別帥、家裡特別有錢,而是他們總能在混亂中找到方向、別人都沒看到的地方發現機會 甚至,你還來不及反應,他們已經在前面三步了。 這種人,你可能以為是「天才」。 但其實,他們只是「開啟了某幾種特別的能力」。 而這些能力,
從根本上說,我們之所以是我們,是因為在某個無法控制的瞬間,另一個真實存在的人回應、拒絕或重新定義了我們。AI 只會永恆地迎合我們的期望,卻無法真正突破我們的自我界限。 如果我們完全隔絕於傷害與干擾之外,我們是否同時也喪失了成為真正「人」的可能性?
Elon Musk於Tesla全體員工大會上,分享了Tesla的未來藍圖,涵蓋電動車、自動駕駛、可持續能源、人形機器人Optimus等,最終願景為實現物質無虞的未來。演講重點提及Tesla的生產成就、工廠擴展、電池技術、自動駕駛技術及AI發展,以及Optimus人形機器人的生產計劃和市場潛力。
我寫小說,也畫畫,剛好方格子正在進行討論 AI 的話題,就來聊一下我自己怎麼運用 AI 的吧。 首先,我並不喜歡直接用 AI 生成的東西取代人工創作,如果可以的話,我會儘可能自己手工創作,因為我使用 AI 的技能並不好,只會跟 ChatGPT 聊天而已。我的經驗是,他創作出來的內容,其實不容易符合
本文探討AI筆記工具的優缺點、選擇建議及未來趨勢,比較NotebookLM、OneNote+Copilot、Notion AI、Obsidian+GPT插件和Palantir Foundry等工具,並強調安全注意事項及個人需求評估的重要性。
你有沒有發現,人生中總有幾種人讓你忍不住多看幾眼? 不是因為他們長得特別帥、家裡特別有錢,而是他們總能在混亂中找到方向、別人都沒看到的地方發現機會 甚至,你還來不及反應,他們已經在前面三步了。 這種人,你可能以為是「天才」。 但其實,他們只是「開啟了某幾種特別的能力」。 而這些能力,
從根本上說,我們之所以是我們,是因為在某個無法控制的瞬間,另一個真實存在的人回應、拒絕或重新定義了我們。AI 只會永恆地迎合我們的期望,卻無法真正突破我們的自我界限。 如果我們完全隔絕於傷害與干擾之外,我們是否同時也喪失了成為真正「人」的可能性?
Elon Musk於Tesla全體員工大會上,分享了Tesla的未來藍圖,涵蓋電動車、自動駕駛、可持續能源、人形機器人Optimus等,最終願景為實現物質無虞的未來。演講重點提及Tesla的生產成就、工廠擴展、電池技術、自動駕駛技術及AI發展,以及Optimus人形機器人的生產計劃和市場潛力。
我寫小說,也畫畫,剛好方格子正在進行討論 AI 的話題,就來聊一下我自己怎麼運用 AI 的吧。 首先,我並不喜歡直接用 AI 生成的東西取代人工創作,如果可以的話,我會儘可能自己手工創作,因為我使用 AI 的技能並不好,只會跟 ChatGPT 聊天而已。我的經驗是,他創作出來的內容,其實不容易符合
本文探討AI筆記工具的優缺點、選擇建議及未來趨勢,比較NotebookLM、OneNote+Copilot、Notion AI、Obsidian+GPT插件和Palantir Foundry等工具,並強調安全注意事項及個人需求評估的重要性。
你可能也想看
Google News 追蹤
Thumbnail
全新 vocus 挑戰活動「方格人氣王」來啦~四大挑戰任你選,留言 / 愛心 / 瀏覽數大 PK,還有新手專屬挑戰!無論你是 vocus 上活躍創作者或剛加入的新手,都有機會被更多人看見,獲得站上版位曝光&豐富獎勵!🏆
Thumbnail
本文探討AI筆記工具的優缺點、選擇建議及未來趨勢,比較NotebookLM、OneNote+Copilot、Notion AI、Obsidian+GPT插件和Palantir Foundry等工具,並強調安全注意事項及個人需求評估的重要性。
Thumbnail
全方位分析脫離繼承戰的方法,大膽猜測誰會成為卡丁國下一任國王。
Thumbnail
SearchGPT 是由 OpenAI 開發的 AI 驅動搜尋引擎,結合了傳統搜尋引擎技術和最新的 AI 技術,能即時從互聯網獲取資訊。它與其他搜尋引擎相比,提供更相關的搜尋結果、更豐富的結果呈現、更快的速度和更好的生態合作基礎建設。
Thumbnail
語言人工智慧公司 DeepL 宣布其平台新增繁體中文,使DeepL 支援的語言達到 33 種。DeepL 為企業和商家量身打造以 AI 驅動的精準翻譯,繁體中文在全球擁有超過 3,300 萬名使用者,繁體中文的推出進一步提升了 DeepL 服務的可及性,象徵著DeepL 在強化全球溝通的重要里程碑。
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
DeepAI 提供「聊天機器人」及「生成圖像」兩種服務,不用註冊就可以免費使用,聊天機器人有多種角色做選擇,能為你的創作和思考過程帶來新的靈感;至於圖像生成功能,也提供多種風格供你選擇,讓你每次生成的圖像都有不同的風格和特色。
Thumbnail
在 AI 研究的領域中,理解和解釋語言模型如何處理和回應特定輸入始終是一項巨大挑戰。這種復雜性不僅限於模型的規模和結構,還涉及到它們如何在內部做出決策。為了應對這一挑戰,OpenAI 推出了一款名為 Transformer Debugger (TDB) 的工具,旨在深入探索小型語言模型的行為
Thumbnail
Anthropic推出了新的Claude 3系列模型,號稱打敗OpenAI GPT-4與Google Gemini,成為地表最強的AI模型。文章介紹了Anthropic公司的核心理念、Claude 3模型家族與GPT-4 Gemini的比較。Claude 3模型在文字與圖像的理解能力都有大幅提升。
Thumbnail
全新 vocus 挑戰活動「方格人氣王」來啦~四大挑戰任你選,留言 / 愛心 / 瀏覽數大 PK,還有新手專屬挑戰!無論你是 vocus 上活躍創作者或剛加入的新手,都有機會被更多人看見,獲得站上版位曝光&豐富獎勵!🏆
Thumbnail
本文探討AI筆記工具的優缺點、選擇建議及未來趨勢,比較NotebookLM、OneNote+Copilot、Notion AI、Obsidian+GPT插件和Palantir Foundry等工具,並強調安全注意事項及個人需求評估的重要性。
Thumbnail
全方位分析脫離繼承戰的方法,大膽猜測誰會成為卡丁國下一任國王。
Thumbnail
SearchGPT 是由 OpenAI 開發的 AI 驅動搜尋引擎,結合了傳統搜尋引擎技術和最新的 AI 技術,能即時從互聯網獲取資訊。它與其他搜尋引擎相比,提供更相關的搜尋結果、更豐富的結果呈現、更快的速度和更好的生態合作基礎建設。
Thumbnail
語言人工智慧公司 DeepL 宣布其平台新增繁體中文,使DeepL 支援的語言達到 33 種。DeepL 為企業和商家量身打造以 AI 驅動的精準翻譯,繁體中文在全球擁有超過 3,300 萬名使用者,繁體中文的推出進一步提升了 DeepL 服務的可及性,象徵著DeepL 在強化全球溝通的重要里程碑。
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
DeepAI 提供「聊天機器人」及「生成圖像」兩種服務,不用註冊就可以免費使用,聊天機器人有多種角色做選擇,能為你的創作和思考過程帶來新的靈感;至於圖像生成功能,也提供多種風格供你選擇,讓你每次生成的圖像都有不同的風格和特色。
Thumbnail
在 AI 研究的領域中,理解和解釋語言模型如何處理和回應特定輸入始終是一項巨大挑戰。這種復雜性不僅限於模型的規模和結構,還涉及到它們如何在內部做出決策。為了應對這一挑戰,OpenAI 推出了一款名為 Transformer Debugger (TDB) 的工具,旨在深入探索小型語言模型的行為
Thumbnail
Anthropic推出了新的Claude 3系列模型,號稱打敗OpenAI GPT-4與Google Gemini,成為地表最強的AI模型。文章介紹了Anthropic公司的核心理念、Claude 3模型家族與GPT-4 Gemini的比較。Claude 3模型在文字與圖像的理解能力都有大幅提升。