【DeepSeek】與其他Ai模型的不同優勢與劣勢

自由靈魂的貓

2025/02/13 更新2025/02/13 發佈閱讀 6 分鐘

鄉巴佬如我，幾天前才從新聞媒體中得知這個最近爆紅的ai模型。據說是比chatgpt的平均性能而言更加優秀的模型。今天，我才第一次試著使用DeepSeek，馬上就被驚艷到了。

我覺得它的思考面向，無論是思考的廣度、深度，都超出我的期待值。我詢問一個範圍有點大的問題，這個問題當然能運用各種不同面向進行分析，DeepSeek卻沒有詢問我想知道的是有關於哪個面向，而是直接考慮到不同的使用者身分，盡量分別都進行分析。

以下便是我今日第一次使用DeepSeek的對話：

問：嗨，請你詳細分析你和其他ai模型(如：chatgpt、copilot、gemini等)有哪些不同之處？你們各自的優勢和劣勢？

以上是DeepSeek的思考過程。

它一開始先從使用者（對方）的需求開始思考，也就是「對方為何要問這個問題」，對方想要從我這裡得到什麼樣的回答？如此根源性的思考，我認為很重要，並且是具有籠統性的提問之中，都應該要先考慮的。

在分析優缺點這部分，它提到「我需要客觀分析，避免偏向自己的模型」，個人覺得是很驚艷的。

最後，它考慮到用戶可能沒有明說的深層需求，以及，避免技術術語過多，保持用戶有好；從這些方面來看，它不但思慮周全，且是設計成為了使用者著想的模型。

說了這麼多優點，它當然還是有不擅長的部分。以下是它對於自己和其他ai模型的分析：

目前市面上主流的AI模型各有其技術特點和應用場景，以下從技術架構、應用場景、優劣勢等角度進行對比分析（基於公開信息，部分技術細節可能涉及廠商未公開內容）：

1. 技術架構與訓練數據

DeepSeek-R1（本模型）
- 基於自主研發的MoE（Mixture-of-Experts）架構
- 中文語料佔比超60%，專門優化中文語義理解
- 採用「思維鏈壓縮」技術提升推理效率
- 支持128k上下文窗口
ChatGPT（GPT-4）
- 基於Transformer架構的稠密模型
- 英文語料主導（約85%+）
- 採用RLHF三階段訓練
- 支持多模態輸入（需特定版本）
Copilot（GPT系列）
- 基於GPT-4架構微調
- 代碼數據佔訓練集70%以上
- 深度集成Visual Studio生態
- 支持實時編譯器反饋調優
Gemini
- 多模態混合架構（Pathways）
- 視頻數據訓練佔比業界最高
- 集成Google搜索實時數據
- 專用TPUv5芯片優化

3. 典型應用場景差異

DeepSeek-R1：中文合同審查、輿情分析、古籍數字化、本地化政策解讀
ChatGPT：創意寫作、學術研究輔助、多語言基礎翻譯
Copilot：代碼自動補全、Debug優化、API文檔生成
Gemini：視頻內容解析、科研數據分析、跨模態搜索

4. 技術局限性

DeepSeek-R1
- 多模態支持僅限圖文（暫無音視頻）
- 小語種處理能力待強化
- 創意生成多樣性弱於GPT-4
ChatGPT
- 中文專業術語錯誤率較高（約15%）
- 實時信息獲取需外掛
- 長文本邏輯一致性下降
Copilot
- 非代碼場景能力薄弱
- 對新框架支持滯後（平均2-3週）
- 雲端依賴性過強
Gemini
- 中文語料佔比不足7%
- 政治敏感話題過濾嚴格
- 視頻解析能耗較高

5. 成本效益分析

API調用成本（每百萬token）：
- DeepSeek-R1：0.8（中文）/0.8（中文）/1.2（英文）
- GPT-4：$6.5
- Gemini Pro：$3.5
- Copilot：綁定IDE訂閱制
本地部署：
- DeepSeek支持私有化部署（最小集群8卡A800）
- Gemini僅提供雲API
- ChatGPT Enterprise需專屬協議

6. 發展趨勢

架構創新：MoE架構在能耗比方面展現優勢（DeepSeek能耗比GPT-4低40%）
領域專精：各廠商加速垂直領域模型分化（如法律、醫療專用版本）
多模態融合：視頻理解能力成為新戰場（Gemini已支持10分鐘長視頻解析）
推理優化：模型小型化與推理加速成共性需求

建議選擇時考量：

中文場景優先選擇DeepSeek
代碼開發首選Copilot
跨國多語言選GPT-4
視頻處理需求用Gemini
合規要求高場景建議私有化部署方案

各模型均在快速迭代中，實際表現建議通過具體任務進行POC測試。需特別注意數據合規要求，金融、醫療等敏感領域建議選擇支持本地部署的解決方案。

【結論】如此看下來，我們可得知：

DeepSeek的劣勢是創意多樣性比GPT-4差

而它的優勢在於各中文領域（古詩、方言等）的理解能力、以及它的知識庫每日更新，還有它提到自己是金融／法律知識專精。不過，各國法律規定都不同，它是否連中國以外的國家，甚至世界上所有國家的法律都能精通呢？我想應該還不至於吧？

如此一來我會好奇的是它對於中國以外的國家的現實情況的掌握程度。還有一些小範圍或是冷門的資訊和知識。

你使用過DeepSeek了嗎？你的使用心得或收穫是？歡迎分享。

共勉

2025.02.13

留言

留言分享你的想法！

有所思，有所感∣一隻自由靈魂的貓

33會員

176內容數

與我一起探尋自我，在思考與感悟之間找到成長的方向。

有所思，有所感∣一隻自由靈魂的貓的其他內容

2025/04/29

迷惘到接納，我的性別認同之旅

從國中時期開始思考性別認同，到大學時期的釋懷。以真誠的筆觸分享作者的性別認同歷程。探討了性別刻板印象、社會壓力等議題。

2025/04/29

迷惘到接納，我的性別認同之旅

從國中時期開始思考性別認同，到大學時期的釋懷。以真誠的筆觸分享作者的性別認同歷程。探討了性別刻板印象、社會壓力等議題。

2025/04/27

【2025台灣礦物展】絕美納米比亞螢石，百慕達三角螢石

記錄第21屆台灣礦物展的參觀心得及戰利品分享！詳細描述了展覽中令人驚豔的螢石。

2025/04/27

【2025台灣礦物展】絕美納米比亞螢石，百慕達三角螢石

記錄第21屆台灣礦物展的參觀心得及戰利品分享！詳細描述了展覽中令人驚豔的螢石。

2025/04/26

【心得】〈論論語之「學」〉譚家哲

閱讀〈論論語之「學」〉後，對於「上達」與「下學」的關係進行細思。

2025/04/26

【心得】〈論論語之「學」〉譚家哲

閱讀〈論論語之「學」〉後，對於「上達」與「下學」的關係進行細思。

看更多

#方格新手的其他內容

方格新手村：讓 vocus 送你見面禮！

目前共 26949 篇

跟著H醫師看世界 Dr.H’s world

從F1賽車淺談心理韌性：Charles Leclerc的悲痛與榮耀

跟著Linko走走拍拍

《台北陽明山。夢幻湖》最平緩路線，訪國際認證寧靜步道，免費停車場&路線建議

文化拾見家

邀請格友分享手機配件的照片(手機殼、吊飾、手機桌面截圖)

你可能也想看

Chloe小窩

手作人必看｜用蝦皮分潤計畫把興趣變新收入渠道

在小小的租屋房間裡，透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材，打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖，並推薦蝦皮分潤計畫。

#手作#黏土手作#輕黏土

2025/09/09

Chloe小窩

手作人必看｜用蝦皮分潤計畫把興趣變新收入渠道

#手作#黏土手作#輕黏土

2025/09/09

小蝸慢慢爬

蝦皮分潤計畫-小豬與小蝸的婚姻神隊友

小蝸和小豬因購物習慣不同常起衝突，直到發現蝦皮分潤計畫，讓小豬的購物愛好產生價值，也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異？讓蝦皮分潤計畫成為你們的神隊友吧！

2025/09/09

2025/09/09

本文探討大型語言模型的發展趨勢，並以DeepSeek-V3為例，分析其在模型架構、訓練方法和效率成本上的改進。作者指出，大型語言模型的競爭焦點已轉向實際應用和數據的運用，而非模型間微小的性能差異。

2025/04/03

2025/04/03

DeepSeek技術的優缺點分析，以及在LLM開發和商業化應用上的潛力評估。文章探討DeepSeek的蒸餾學習機制，並與傳統的生成式AI訓練方法進行比較，同時也提及強化學習在提升模型性能中的關鍵作用。最後，作者從企業資安角度出發，對DeepSeek的應用提出保留意見，但仍肯定其發展前景。

2025/03/10

2025/03/10

[003-01]DeepSeek 在中國的崛起：政府支持、產業應用與挑戰

DeepSeek，憑藉其低成本、高性能的大型語言模型 (LLM) R1，迅速在中國市場普及。成功的因素，包括政府政策支持、成本優勢、開源策略、本土化優勢以及產學研合作。其在醫療、政府服務及其他產業的應用現況，並探討其面臨的挑戰與爭議等。比較DeepSeek與ChatGPT的優劣，並展望未來發展潛力。

#DeepSeek#ChatGPT#模型

2025/03/06

Kaori的碗豆園

[003-01]DeepSeek 在中國的崛起：政府支持、產業應用與挑戰

#DeepSeek#ChatGPT#模型

2025/03/06

AI.ESG.數位轉型顧問沈重宗

深度探討DeepSeek與安卓商業模式的比較分析在人工智慧（AI）領域，DeepSeek的崛起引發了廣泛關注。

深度探討DeepSeek與安卓商業模式的比較分析在人工智慧（AI）領域，DeepSeek的崛起引發了廣泛關注。作為一家中國公司，DeepSeek不僅在技術上取得了顯著進展，還在商業模式上展現出與安卓相似的特徵。本文將深入分析DeepSeek如何模仿安卓的商業模式，並探討其對AI行業的

#DeepSeek#安卓#商業

2025/02/27

AI.ESG.數位轉型顧問沈重宗

深度探討DeepSeek與安卓商業模式的比較分析在人工智慧（AI）領域，DeepSeek的崛起引發了廣泛關注。

#DeepSeek#安卓#商業

2025/02/27

有所思，有所感∣一隻自由靈魂的貓

【DeepSeek】與其他Ai模型的不同優勢與劣勢

詳述DeepSeek與其他AI模型的比較，並探討優勢、劣勢及應用領域。 DeepSeek優勢在於中文語義理解，以及金融和法律領域的專業知識，但創意多樣性略遜於GPT-4。

#DeepSeek#ChatGPT#GPT-4

2025/02/13

有所思，有所感∣一隻自由靈魂的貓

【DeepSeek】與其他Ai模型的不同優勢與劣勢

#DeepSeek#ChatGPT#GPT-4

2025/02/13

朵小芸的草味沙龍

2025年AI模型API比較：DeepSeek V3、GPT-4o和Claude 3.5 的全面評估

DeepSeek，一家中國AI新創公司，以其低成本、高性能的大型語言模型崛起，挑戰AI晶片軍備競賽。文章比較了DeepSeek V3與其他領先模型(如GPT-4o, Gemini, Claude等)的優勢和應用場景，並展望了邊緣AI技術的未來。

#DeepSeek#GPT-4o#模型

2025/02/07

朵小芸的草味沙龍

2025年AI模型API比較：DeepSeek V3、GPT-4o和Claude 3.5 的全面評估

#DeepSeek#GPT-4o#模型

2025/02/07

真師傅的AI沙龍

#DeepSeek 的自白書 #DeepSeek和其他AI的區別，為什麼需要列出思路流程?

分析DeepSeek和其他AI的區別，為什麼需要列出思路流程? 首先需要確認使用者所說的“其他AI”具體指哪些，可能是指像OpenAI的GPT系列、Google的Bard，或者Meta的LLaMA之類的模型。不過使用者可能泛指市場上主流的通用大模型。DeepSeek是由中國的深度求索公司開發的

#DeepSeek#人工智能#DeepSeek的自白書

2025/02/03

真師傅的AI沙龍

#DeepSeek 的自白書 #DeepSeek和其他AI的區別，為什麼需要列出思路流程?

#DeepSeek#人工智能#DeepSeek的自白書

2025/02/03

極致數位行銷的沙龍

Deepseek的出現，重挫了AI產業，長久以來的價值觀

#Deepseek的出現，重挫了AI產業，長久以來的價值觀自從 2022年11月，ChatGPT 發布後，大型語言模型 ( LLM ) 成為了 AI 研究的主軸，因為，大家發現，LLM 具有「顯現能力」( Emergent Abilities ) 也就是，較小的模型無法做到的

2025/01/28

極致數位行銷的沙龍

Deepseek的出現，重挫了AI產業，長久以來的價值觀

2025/01/28

狐思亂想的沙龍

夯番薯週記｜DeepSeek

在這一個月內中國Ai新創公司發表 DeepSeek-V3 和 DeepSeek-R1 兩款大語言模型，其中R1模型僅花費600萬美元，並在兩個月內完成訓練；相較於美國Ai巨頭動輒上億美金的模型訓練費，打破了傳統認知「高成本高效能」，並且在成果上顯示，DeepSeek在許多方面都與當今最強的模型並列。

2025/01/28

2025/01/28

DeepSeek與常見的「生成程式語言模型」進行比較

以下將 DeepSeek（特別是其程式碼生成產品 DeepSeek Coder）與目前市面上常見的「生成程式語言模型」進行比較，包括 OpenAI 的 GPT-4（或 GPT-3.5 Codex）、Google 的 Codey、Meta 的 Code Llama、以及社群開源模型如 StarCode

#GPT-4#模型#OpenAI

2025/01/27

DA的美股日記

DeepSeek與常見的「生成程式語言模型」進行比較

#GPT-4#模型#OpenAI

2025/01/27

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News