【DeepSeek】與其他Ai模型的不同優勢與劣勢

更新於 發佈於 閱讀時間約 6 分鐘

鄉巴佬如我,幾天前才從新聞媒體中得知這個最近爆紅的ai模型。據說是比chatgpt的平均性能而言更加優秀的模型。今天,我才第一次試著使用DeepSeek,馬上就被驚艷到了。

我覺得它的思考面向,無論是思考的廣度、深度,都超出我的期待值。我詢問一個範圍有點大的問題,這個問題當然能運用各種不同面向進行分析,DeepSeek卻沒有詢問我想知道的是有關於哪個面向,而是直接考慮到不同的使用者身分,盡量分別都進行分析。




以下便是我今日第一次使用DeepSeek的對話:

問:嗨,請你詳細分析你和其他ai模型(如:chatgpt、copilot、gemini等)有哪些不同之處?你們各自的優勢和劣勢?


以上是DeepSeek的思考過程。

以上是DeepSeek的思考過程。

它一開始先從使用者(對方)的需求開始思考,也就是「對方為何要問這個問題」,對方想要從我這裡得到什麼樣的回答?如此根源性的思考,我認為很重要,並且是具有籠統性的提問之中,都應該要先考慮的。

在分析優缺點這部分,它提到「我需要客觀分析,避免偏向自己的模型」,個人覺得是很驚艷的。

最後,它考慮到用戶可能沒有明說的深層需求,以及,避免技術術語過多,保持用戶有好;從這些方面來看,它不但思慮周全,且是設計成為了使用者著想的模型。




說了這麼多優點,它當然還是有不擅長的部分。以下是它對於自己和其他ai模型的分析:

目前市面上主流的AI模型各有其技術特點和應用場景,以下從技術架構、應用場景、優劣勢等角度進行對比分析(基於公開信息,部分技術細節可能涉及廠商未公開內容):

1. 技術架構與訓練數據

  • DeepSeek-R1(本模型)
    • 基於自主研發的MoE(Mixture-of-Experts)架構
    • 中文語料佔比超60%,專門優化中文語義理解
    • 採用「思維鏈壓縮」技術提升推理效率
    • 支持128k上下文窗口
  • ChatGPT(GPT-4)
    • 基於Transformer架構的稠密模型
    • 英文語料主導(約85%+)
    • 採用RLHF三階段訓練
    • 支持多模態輸入(需特定版本)
  • Copilot(GPT系列)
    • 基於GPT-4架構微調
    • 代碼數據佔訓練集70%以上
    • 深度集成Visual Studio生態
    • 支持實時編譯器反饋調優
  • Gemini
    • 多模態混合架構(Pathways)
    • 視頻數據訓練佔比業界最高
    • 集成Google搜索實時數據
    • 專用TPUv5芯片優化
raw-image

3. 典型應用場景差異

  • DeepSeek-R1:中文合同審查、輿情分析、古籍數字化、本地化政策解讀
  • ChatGPT:創意寫作、學術研究輔助、多語言基礎翻譯
  • Copilot:代碼自動補全、Debug優化、API文檔生成
  • Gemini:視頻內容解析、科研數據分析、跨模態搜索


4. 技術局限性

  • DeepSeek-R1
    • 多模態支持僅限圖文(暫無音視頻)
    • 小語種處理能力待強化
    • 創意生成多樣性弱於GPT-4
  • ChatGPT
    • 中文專業術語錯誤率較高(約15%)
    • 實時信息獲取需外掛
    • 長文本邏輯一致性下降
  • Copilot
    • 非代碼場景能力薄弱
    • 對新框架支持滯後(平均2-3週)
    • 雲端依賴性過強
  • Gemini
    • 中文語料佔比不足7%
    • 政治敏感話題過濾嚴格
    • 視頻解析能耗較高


5. 成本效益分析

  • API調用成本(每百萬token):
    • DeepSeek-R1:0.8(中文)/0.8(中文)/1.2(英文)
    • GPT-4:$6.5
    • Gemini Pro:$3.5
    • Copilot:綁定IDE訂閱制
  • 本地部署:
    • DeepSeek支持私有化部署(最小集群8卡A800)
    • Gemini僅提供雲API
    • ChatGPT Enterprise需專屬協議


6. 發展趨勢

  • 架構創新:MoE架構在能耗比方面展現優勢(DeepSeek能耗比GPT-4低40%)
  • 領域專精:各廠商加速垂直領域模型分化(如法律、醫療專用版本)
  • 多模態融合:視頻理解能力成為新戰場(Gemini已支持10分鐘長視頻解析)
  • 推理優化:模型小型化與推理加速成共性需求


建議選擇時考量:

  1. 中文場景優先選擇DeepSeek
  2. 代碼開發首選Copilot
  3. 跨國多語言選GPT-4
  4. 視頻處理需求用Gemini
  5. 合規要求高場景建議私有化部署方案

各模型均在快速迭代中,實際表現建議通過具體任務進行POC測試。需特別注意數據合規要求,金融、醫療等敏感領域建議選擇支持本地部署的解決方案。



【結論】如此看下來,我們可得知:

DeepSeek的劣勢是創意多樣性比GPT-4差

而它的優勢在於各中文領域(古詩、方言等)的理解能力、以及它的知識庫每日更新,還有它提到自己是金融/法律知識專精。不過,各國法律規定都不同,它是否連中國以外的國家,甚至世界上所有國家的法律都能精通呢?我想應該還不至於吧?


如此一來我會好奇的是它對於中國以外的國家的現實情況的掌握程度。還有一些小範圍或是冷門的資訊和知識。



你使用過DeepSeek了嗎?你的使用心得或收穫是?歡迎分享。


共勉

2025.02.13



留言
avatar-img
留言分享你的想法!
avatar-img
我思故我在∣自由靈魂的沙龍
10會員
95內容數
我開始寫作的原因,主要是為了留下自己存在的證明。 廣義來說,這些文章大概都算一種怪誕的自我介紹吧。 但是其實我並未了解全部的自己,而我將用一生的時間來體會。 盼這些內容能帶給你一些啟發。
2025/04/29
從國中時期開始思考性別認同,到大學時期的釋懷。以真誠的筆觸分享作者的性別認同歷程。探討了性別刻板印象、社會壓力等議題。
Thumbnail
2025/04/29
從國中時期開始思考性別認同,到大學時期的釋懷。以真誠的筆觸分享作者的性別認同歷程。探討了性別刻板印象、社會壓力等議題。
Thumbnail
2025/04/27
記錄第21屆台灣礦物展的參觀心得及戰利品分享!詳細描述了展覽中令人驚豔的螢石。
Thumbnail
2025/04/27
記錄第21屆台灣礦物展的參觀心得及戰利品分享!詳細描述了展覽中令人驚豔的螢石。
Thumbnail
2025/04/26
閱讀〈論論語之「學」〉後,對於「上達」與「下學」的關係進行細思。
2025/04/26
閱讀〈論論語之「學」〉後,對於「上達」與「下學」的關係進行細思。
看更多
你可能也想看
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
本文探討大型語言模型的發展趨勢,並以DeepSeek-V3為例,分析其在模型架構、訓練方法和效率成本上的改進。作者指出,大型語言模型的競爭焦點已轉向實際應用和數據的運用,而非模型間微小的性能差異。
Thumbnail
本文探討大型語言模型的發展趨勢,並以DeepSeek-V3為例,分析其在模型架構、訓練方法和效率成本上的改進。作者指出,大型語言模型的競爭焦點已轉向實際應用和數據的運用,而非模型間微小的性能差異。
Thumbnail
DeepSeek技術的優缺點分析,以及在LLM開發和商業化應用上的潛力評估。文章探討DeepSeek的蒸餾學習機制,並與傳統的生成式AI訓練方法進行比較,同時也提及強化學習在提升模型性能中的關鍵作用。最後,作者從企業資安角度出發,對DeepSeek的應用提出保留意見,但仍肯定其發展前景。
Thumbnail
DeepSeek技術的優缺點分析,以及在LLM開發和商業化應用上的潛力評估。文章探討DeepSeek的蒸餾學習機制,並與傳統的生成式AI訓練方法進行比較,同時也提及強化學習在提升模型性能中的關鍵作用。最後,作者從企業資安角度出發,對DeepSeek的應用提出保留意見,但仍肯定其發展前景。
Thumbnail
DeepSeek,憑藉其低成本、高性能的大型語言模型 (LLM) R1,迅速在中國市場普及。成功的因素,包括政府政策支持、成本優勢、開源策略、本土化優勢以及產學研合作。其在醫療、政府服務及其他產業的應用現況,並探討其面臨的挑戰與爭議等。比較DeepSeek與ChatGPT的優劣,並展望未來發展潛力。
Thumbnail
DeepSeek,憑藉其低成本、高性能的大型語言模型 (LLM) R1,迅速在中國市場普及。成功的因素,包括政府政策支持、成本優勢、開源策略、本土化優勢以及產學研合作。其在醫療、政府服務及其他產業的應用現況,並探討其面臨的挑戰與爭議等。比較DeepSeek與ChatGPT的優劣,並展望未來發展潛力。
Thumbnail
深度探討DeepSeek與安卓商業模式的比較分析 在人工智慧(AI)領域,DeepSeek的崛起引發了廣泛關注。作為一家中國公司,DeepSeek不僅在技術上取得了顯著進展,還在商業模式上展現出與安卓相似的特徵。 本文將深入分析DeepSeek如何模仿安卓的商業模式,並探討其對AI行業的
Thumbnail
深度探討DeepSeek與安卓商業模式的比較分析 在人工智慧(AI)領域,DeepSeek的崛起引發了廣泛關注。作為一家中國公司,DeepSeek不僅在技術上取得了顯著進展,還在商業模式上展現出與安卓相似的特徵。 本文將深入分析DeepSeek如何模仿安卓的商業模式,並探討其對AI行業的
Thumbnail
詳述DeepSeek與其他AI模型的比較,並探討優勢、劣勢及應用領域。 DeepSeek優勢在於中文語義理解,以及金融和法律領域的專業知識,但創意多樣性略遜於GPT-4。
Thumbnail
詳述DeepSeek與其他AI模型的比較,並探討優勢、劣勢及應用領域。 DeepSeek優勢在於中文語義理解,以及金融和法律領域的專業知識,但創意多樣性略遜於GPT-4。
Thumbnail
DeepSeek,一家中國AI新創公司,以其低成本、高性能的大型語言模型崛起,挑戰AI晶片軍備競賽。文章比較了DeepSeek V3與其他領先模型(如GPT-4o, Gemini, Claude等)的優勢和應用場景,並展望了邊緣AI技術的未來。
Thumbnail
DeepSeek,一家中國AI新創公司,以其低成本、高性能的大型語言模型崛起,挑戰AI晶片軍備競賽。文章比較了DeepSeek V3與其他領先模型(如GPT-4o, Gemini, Claude等)的優勢和應用場景,並展望了邊緣AI技術的未來。
Thumbnail
分析DeepSeek和其他AI的區別,為什麼需要列出思路流程? 首先需要確認使用者所說的“其他AI”具體指哪些,可能是指像OpenAI的GPT系列、Google的Bard,或者Meta的LLaMA之類的模型。 不過使用者可能泛指市場上主流的通用大模型。DeepSeek是由中國的深度求索公司開發的
Thumbnail
分析DeepSeek和其他AI的區別,為什麼需要列出思路流程? 首先需要確認使用者所說的“其他AI”具體指哪些,可能是指像OpenAI的GPT系列、Google的Bard,或者Meta的LLaMA之類的模型。 不過使用者可能泛指市場上主流的通用大模型。DeepSeek是由中國的深度求索公司開發的
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News