DeepSeek 是什麼?關於 DeepSeek 你必須知道的 8 件事

更新於 發佈於 閱讀時間約 11 分鐘

DeepSeek 是什麼?主打開源、平價、效率優先的語言模型

DeepSeek 是一家來自中國杭州的新創 AI 公司,由金融背景出身的梁文鋒在 2023 年創辦。短短不到兩年時間,就靠 DeepSeek-R1 和 V3 兩個自研模型打進全球視野。其中 R1 模型的訓練成本不到 600 萬美元,卻已經可以在推理能力上與 GPT-4 等級的模型比肩。

過去,大型語言模型(像 GPT-4)通常是矽谷科技巨頭才玩得起的遊戲,要有頂級算力、超大預算、請上百位工程師。但 DeepSeek 卻選擇走一條不同的路線:開源、平價、效率優先

DeepSeek 不是第一個做大型語言模型的,規模也不是最大的,但它特別之處在於:

  • 把模型開源,讓更多人能免費下載使用
  • 用更低的成本做出高水準的效果
  • 讓 AI 不再只是矽谷的專利,而是更平民、更普及的科技

DeepSeek 的出現,也反映出整個 AI 產業的新方向:不只是看誰模型最大、能力最強,還要思考怎麼讓技術變得更可用、可部署、可負擔

關於 DeepSeek 你必須知道的 8 件事

1. DeepSeek 目前有 V3 和 R1 兩種模型

DeepSeek 於 2024 年底一口氣推出兩款大型語言模型:DeepSeek-V3 和 DeepSeek-R1,兩者各有強項以及適合使用的族群。

DeepSeek-V3:採用最新的「混合專家模型(MoE)」,意思是它雖然擁有高達 6,710 億個參數,但實際運作時只會根據你的需求調用其中的約 370 億個參數,因此可以節省大量運算資源,讓模型運行起來更快速。V3 特別擅長處理日常語言對話、文章撰寫與翻譯,適合需要處理語言相關工作的使用者或企業去使用。

DeepSeek-R1:則更像是為了「腦力激盪」而設計的,主打邏輯推理、數學運算與程式設計,尤其是中高難度的推理、編寫代碼上表現亮眼。R1 不但能真的理解語言,還能做到「思考與解題」,因此常常被拿來跟 GPT-4 一起比較。

  • 如果你想要用 AI 來幫忙寫文案、摘要、翻譯,可以選擇 DeepSeek-V3 模型。
  • 如果你需要用 AI 來幫忙解題、寫程式或做比較深度的分析,建議可以 使用 DeepSeek-R1。

2. DeepSeek-V3 更快、更省電、也更省錢

雖然 DeepSeek-V3 總共擁有高達 6,710 億個參數,但在實際運作時,V3 只會啟用其中大概 370 億個參數。這是一種叫做「混合專家架構(MoE)」的技術。

你可以想像 V3 就是一個超大型的顧問團隊,裡面有數千位的顧問與專家。每次遇到問題時,V3 不會讓所有專家一起出動,而是只會叫出最合適的幾位專家來幫你解決問題。這樣做的好處是:

  • 更省電:不需要讓整個模型全部運轉。
  • 更省錢:對設備的需求相對較低。
  • 反應更快:因為處理速度會比較快,使用上也會比較流暢。

這種架構的最大優點就是,在保有高效能的同時,也能降低 AI 模型的運算成本,讓企業或開發者可以用更少的資源做到更多事。

MoE 架構讓 DeepSeek-V3 成為目前少數可以同時兼顧「規模大」與「成本低」的模型之一,這也是它能迅速走紅的原因之一。

3. DeepSeek-R1 具備「邏輯推理」能力

許多 AI 模型只能照著資料回答問題,但 R1 的最大特色在於擁有「邏輯推理能力」。它在面對複雜的問題時,不會急著找答案,而是會先拆解問題、接著逐條分析,最後再提出合理的 solution。

舉個例子,當你問 R1 一個數學題目,它不會直接吐出結論,而是會像人類一樣,先逐步列出思路和過程,讓我們可以更容易理解它的推理方式。

這種能力也讓 R1 特別適合處理以下任務:

  • 數學問題
  • 編程相關問題
  • 科學的推論與模擬
  • 長篇邏輯問答

除此之外,R1 也擁有「強化學習」與「類比推理」的能力,因此能夠從過去的錯誤中學習,並在不同情境下調整解題方法,展現出類似人類的「學習與迭代能力」。

這種像是人類「自主思考」的能力,也讓 R1 被外界認為是目前最接近 GPT-4 的 AI 模型之一。

4. DeepSeek-R1 vs GPT-4,誰更強大?

根據公開資料,DeepSeek-R1 的訓練成本大約為 600 萬美元,相較之下,GPT-4 的開發預算據估超過 1 億美元。這樣的成本差距讓外界好奇:R1 跟 GPT-4 的性能到底誰好誰壞?

從多項測試來看,R1 的表現雖然沒有全面領先,但在某些任務上的表現確實與 GPT-4 系列不相上下:

  • MATH-500(高難度數學題):R1 得分為 97.3%,略高於 OpenAI o1 的 96.4%
  • MMLU(多任務語言理解):R1 取得 90.8%,接近 o1 的 91.8%。這項測試涵蓋多達 57 個學科,包括 STEM、人文與社會領域,是評估模型「知識廣度」與「推理能力」的重要標準。
  • HumanEval(程式碼生成) :R1 表現相對保守,正確率為 84.3%,明顯低於 GPT-4 Turbo 的 92%

綜合來看,R1 的優勢主要集中在數學推理與邏輯分析等領域,但如果是創造力、多領域應用與語言生成的穩定性,GPT-4 仍展現出更完整的守備範圍。

值得一提的是,R1 採用的是輕量化設計與優化後的執行流程,這讓它能夠在低硬體條件與有限預算下達成接近 GPT-4 的表現。但是,這樣的設計也可能讓 R1 在某些任務上無法達到 GPT-4 擁有的知識深度與廣泛度。

5. DeepSeek 一推出衝擊全球晶片與 AI 市場,NVIDIA 股價重挫

DeepSeek 推出後不僅在 AI 領域引發了話題,也意外影響了股票市場。因為它的推出代表了:就算不用高階晶片,也能訓練出媲美 ChatGPT 的 AI 模型

這項突破打破了原本「硬體越高階=AI 越強」的產業邏輯。許多投資人開始擔心如果 AI 模型能夠用更低成本的方式去訓練,那麼全球對高階 AI 晶片的需求可能會大幅受到影響。

就在 R1 模型引發討論的隔天,美股出現明顯波動。NVIDIA 股價一度大跌超過 16%,市值蒸發近 6,000 億美元,連帶影響台積電、超微(AMD)等半導體股跟著下滑。

部分分析指出,DeepSeek 並不是直接挑戰晶片製造商的地位,而是間接讓市場重新評估對 AI 模型的成本想像。這對於投資人來說是一個全新的訊號:AI 不再只是砸錢堆算力的軍備競賽,同時也要考慮到工程與效率的開發

6. 涉及審查與敏感議題:DeepSeek 也會「選擇性失憶」

DeepSeek 雖然在技術上表現亮眼,但它也有一個很現實的限制:當你問它一些「比較敏感」的問題時,DeepSeek 一開始會好像想回,但訊息打到一半就會突然消失,然後跳出一句:「這個問題我目前還不太確定該怎麼回答,不如我們來聊聊數學或寫程式吧!」

The Guardian》也指出,DeepSeek 會「即時審查自己」,特別是遇到涉及中國政治的話題時。

雖然 DeepSeek 有釋出部分的開源模型,讓開發者可以自己安裝在本地電腦上使用(那些版本比較少限制),但如果你是用 WEB 版或 App,自我審查幾乎一定會在。

這種「選擇性失憶」的機制,和其他中國 AI(像百度的文心一言、抖音母公司的豆包)很像。雖然不會影響數學、寫程式、做資料整理這些功能,但對於想要用它來查詢知識、做國際議題研究的人來說,確實是一種內容上的限制。

簡單來說,如果你只是想拿來寫文章、編程、輔助工作、當學習助理,使用 DeepSeek 完全沒有問題

但如果你想要靠 DeepSeek 來了解世界上發生什麼事,它的「記憶」可能會有一些空白。

7. DeepSeek 引發國際關注與封鎖:台灣、美國、義大利已限制使用

DeepSeek 推出後,各國政府對此保持高度警覺,原因也很簡單:DeepSeek 的資料到底存在哪裡?又會怎麼去使用這些資料?

像台灣、美國、義大利等國,都已經對 DeepSeek 發布禁令,有些國家禁止政府機關使用,有些則乾脆要求下架 APP。這些國家普遍的疑慮有兩個:

  • 資料隱私:使用者的對話資料,會不會被儲存在中國伺服器?
  • 國家安全:如果使用者的對話資料被分析、挖掘,是否可能成為國安的風險來源?

台灣行政院資安處也提醒,這類 AI 工具背後的資料來源與運作流程,如果不夠透明,就有可能成為駭客或監控工具的突破口。

雖然 DeepSeek 官方強調他們遵守法律,並表示有能力提供「離線部署」版本(例如讓企業自行架設在內網中使用),但這樣的技術門檻對一般人來說並不低。

所以很多國家乾脆先採取「預防性封鎖」,等相關機制釐清後再來討論解禁。畢竟在 AI 時代,資料就是資產,同時也可能是風險。

8. DeepSeek 出現的意義:推進 AI 普及化

以前想用一套強大的 AI 模型,可能得砸幾千萬美金、買一堆昂貴晶片、還得找一整隊工程師。但 DeepSeek 的出現,讓這一切開始變得不一樣,因為它選擇開源,讓大家都能免費使用。

他們把自己開發的模型像 R1、V3 等,都以 MIT 授權 方式釋出,開發者可以自由下載、安裝、甚至改寫應用,這讓中小型團隊也開始有機會做出屬於自己的 AI 工具。

像現在,已經有超過 30 萬名開發者在 DeepSeek 基礎上打造出各式各樣的應用,有人用它做教育,有人開發醫療輔助系統,也有人拿來改進客服體驗。

除了開源,DeepSeek 還把「低成本」做到了極致。他們的 R1 模型訓練費用大約只有 600 萬美元,比起市面上動輒數億的對手,大幅降低了進入 AI 開發的門檻。這代表,就算你不是矽谷巨頭,也有機會參與現在的 AI 競賽。

這也是為什麼有越來越多人說:DeepSeek 正在加速 AI 的普及化。它不只是推出一個 AI,而是把工具、知識、資源變成大家都能用的東西。這種「讓更多人能使用」的思維,才是它推出背後的意義。

未來的 AI,不一定只屬於幾間科技巨頭,也可以屬於你我這樣的普通人。

留言
avatar-img
留言分享你的想法!
avatar-img
PressPlay Academy|線上課程學習平台的沙龍
0會員
13內容數
2025/06/13
Gemini 是什麼?由 Google 打造的多模態大型語言模型 Gemini 是 Google 打造的全新一代人工智慧模型,也是目前最具野心的多模態 AI 系統之一。不同於傳統只能處理文字的語言模型,Gemini 可以同時理解與處理文字、圖片、影片、程式碼甚至聲音,具備跨領域的理解與推理能力。簡
Thumbnail
2025/06/13
Gemini 是什麼?由 Google 打造的多模態大型語言模型 Gemini 是 Google 打造的全新一代人工智慧模型,也是目前最具野心的多模態 AI 系統之一。不同於傳統只能處理文字的語言模型,Gemini 可以同時理解與處理文字、圖片、影片、程式碼甚至聲音,具備跨領域的理解與推理能力。簡
Thumbnail
2025/06/12
AI Agent 是什麼?AI Agent 的定義 AI Agent 的中文是「AI 代理」,是一種能自動幫你完成任務的人工智慧系統。 它不只是像傳統的聊天機器人(Chatbot)一樣回答問題,而是可以自己思考、自己找資料,甚至一步一步自主完成任務。 人類只需要設定一個最終目標,AI Agen
Thumbnail
2025/06/12
AI Agent 是什麼?AI Agent 的定義 AI Agent 的中文是「AI 代理」,是一種能自動幫你完成任務的人工智慧系統。 它不只是像傳統的聊天機器人(Chatbot)一樣回答問題,而是可以自己思考、自己找資料,甚至一步一步自主完成任務。 人類只需要設定一個最終目標,AI Agen
Thumbnail
2025/06/11
紫微斗數是什麼? 紫微斗數是源自中國古代的一種命理工具,會根據一個人的出生年月日和時辰(也就是生辰八字)來排出一張命盤,命盤上有十二個宮位,可以用來分析一個人的個性、運勢以及人生發展。 這門學問結合了天文觀測和易經理論,核心思想是「天人合一」,也就是天上的星象和人間的事會互相影響。跟其他命理系統
Thumbnail
2025/06/11
紫微斗數是什麼? 紫微斗數是源自中國古代的一種命理工具,會根據一個人的出生年月日和時辰(也就是生辰八字)來排出一張命盤,命盤上有十二個宮位,可以用來分析一個人的個性、運勢以及人生發展。 這門學問結合了天文觀測和易經理論,核心思想是「天人合一」,也就是天上的星象和人間的事會互相影響。跟其他命理系統
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
SearchGPT 是由 OpenAI 開發的 AI 驅動搜尋引擎,結合了傳統搜尋引擎技術和最新的 AI 技術,能即時從互聯網獲取資訊。它與其他搜尋引擎相比,提供更相關的搜尋結果、更豐富的結果呈現、更快的速度和更好的生態合作基礎建設。
Thumbnail
SearchGPT 是由 OpenAI 開發的 AI 驅動搜尋引擎,結合了傳統搜尋引擎技術和最新的 AI 技術,能即時從互聯網獲取資訊。它與其他搜尋引擎相比,提供更相關的搜尋結果、更豐富的結果呈現、更快的速度和更好的生態合作基礎建設。
Thumbnail
語言人工智慧公司 DeepL 宣布其平台新增繁體中文,使DeepL 支援的語言達到 33 種。DeepL 為企業和商家量身打造以 AI 驅動的精準翻譯,繁體中文在全球擁有超過 3,300 萬名使用者,繁體中文的推出進一步提升了 DeepL 服務的可及性,象徵著DeepL 在強化全球溝通的重要里程碑。
Thumbnail
語言人工智慧公司 DeepL 宣布其平台新增繁體中文,使DeepL 支援的語言達到 33 種。DeepL 為企業和商家量身打造以 AI 驅動的精準翻譯,繁體中文在全球擁有超過 3,300 萬名使用者,繁體中文的推出進一步提升了 DeepL 服務的可及性,象徵著DeepL 在強化全球溝通的重要里程碑。
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
本篇文章深入探討了大型企業導入AI技術時,代理商和IT顧問公司的重要角色,並提供了對股票投資的分析觀察。文章中包含了對Accenture(艾森哲)公司和AMD等公司的投資理由,以及市場預期的未來預測。
Thumbnail
本篇文章深入探討了大型企業導入AI技術時,代理商和IT顧問公司的重要角色,並提供了對股票投資的分析觀察。文章中包含了對Accenture(艾森哲)公司和AMD等公司的投資理由,以及市場預期的未來預測。
Thumbnail
這篇文章探討了一家專注於人工智能和搜索引擎優化工具的科技公司的成立及發展,以及該公司面臨的遙距工作中的文化差異和管理挑戰。同時也介紹了該公司的市場前景和營運現況以及提出了在遙距工作中促進交流和精神健康的管理策略。
Thumbnail
這篇文章探討了一家專注於人工智能和搜索引擎優化工具的科技公司的成立及發展,以及該公司面臨的遙距工作中的文化差異和管理挑戰。同時也介紹了該公司的市場前景和營運現況以及提出了在遙距工作中促進交流和精神健康的管理策略。
Thumbnail
致力於研發 AI 翻譯的德國新創 DeepL,是 Google 翻譯強勁的競爭對手,2023 年 1 月至今估值已經翻倍成長,上探 20 億美元(約新台幣 643.1 億元)。
Thumbnail
致力於研發 AI 翻譯的德國新創 DeepL,是 Google 翻譯強勁的競爭對手,2023 年 1 月至今估值已經翻倍成長,上探 20 億美元(約新台幣 643.1 億元)。
Thumbnail
筆記-股癌-24.06.08 *達哥是聯發科生成式AI服務平台,原先看法是用來coding、問問題。 -RIG(加強功能),給更多公司內部資料,減少幻覺問題,讓回答更佳精準。 -RIG就是open book,直接開答案來看。 -Embedded是讓模型重新學習一個新技能。 -RIG與Emb
Thumbnail
筆記-股癌-24.06.08 *達哥是聯發科生成式AI服務平台,原先看法是用來coding、問問題。 -RIG(加強功能),給更多公司內部資料,減少幻覺問題,讓回答更佳精準。 -RIG就是open book,直接開答案來看。 -Embedded是讓模型重新學習一個新技能。 -RIG與Emb
Thumbnail
隨著人工智慧和大型語言模型(LLMs)的快速發展,AI Singapore與Google Research合作推出的SEALD計畫旨在收集和加強東南亞九種語言的多語言數據集,提升這些語言大型語言模型的文化意識和應用能力,推動東南亞語言和文化敏感性的LLMs的發展。
Thumbnail
隨著人工智慧和大型語言模型(LLMs)的快速發展,AI Singapore與Google Research合作推出的SEALD計畫旨在收集和加強東南亞九種語言的多語言數據集,提升這些語言大型語言模型的文化意識和應用能力,推動東南亞語言和文化敏感性的LLMs的發展。
Thumbnail
本篇文章介紹了智能投資、科技與金融的結合,以及相關的投資策略與市場趨勢。內容涉及科技產品的市場需求與供應、個人生活與體悟、產業分析與市場觀察、臺股市場表現與個人心態、AI技術發展等各方面。文章中提到了一些公司和產品的名稱,如OpenAI的Sora、Supermicro等。
Thumbnail
本篇文章介紹了智能投資、科技與金融的結合,以及相關的投資策略與市場趨勢。內容涉及科技產品的市場需求與供應、個人生活與體悟、產業分析與市場觀察、臺股市場表現與個人心態、AI技術發展等各方面。文章中提到了一些公司和產品的名稱,如OpenAI的Sora、Supermicro等。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News