深度求索 DeepSeek：低成本AI模型引發的產業變革與未來趨勢預測

水源駝哥

2025/02/03 更新2025/01/28 發佈閱讀 12 分鐘

投資理財內容聲明

先說結論：我認為目前華爾街過度恐慌 (人為製造買點？)；矽谷會重新思考成本優化的重要性。本篇文章只探討個人理性認為的產業現狀，不構成任何投資建議，因為資本市場很多時候是不理性的

▋橫空出世的 DeepSeek 與產業動盪

先簡單說明一下本文背景。近期，一家名為DeepSeek的中國人工智慧（AI）初創公司橫空出世，迅速引起全球關注

該公司近期推出的AI模型DeepSeek-R1，以僅約600萬美元的低成本開發，且在高端晶片的數量受到限制的情況下，性能卻可與美國領先的AI模型媲美。這一突破不僅震撼了矽谷，也在華爾街引發了巨大波動

DeepSeek的崛起導致美國主要科技股市值大幅縮水，單日蒸發近1兆美元。其中，Nvidia股價下跌17%，創下歷史新高，其他科技巨頭如微軟、特斯拉等也受到波及

美國總統川普也表示，DeepSeek的出現應該成為美國企業的「警鐘」，敦促它們加強在AI領域的競爭力。同時，市場分析師也在討論DeepSeek的成功是否會對矽谷產生正面影響，迫使其以更低的成本進行創新

(圖) 中國 AI 模型 DeepSeek 深度求索

▋DeepSeek 如何引發矽谷大地震？

最近，社群媒體與科技網站上充斥著各種關於 DeepSeek 的測評文章，許多評測認為，它的性能與 OpenAI 的GPT-o1 相當，甚至有些認為 o1 模型略勝一籌

如果 DeepSeek 只是在性能上接近 GPT-o1，那麼它可能只是中國 AI 產業的又一個「大外宣」產品。然而，這家原本默默無聞的小公司，卻讓矽谷的科技巨頭震驚，甚至引發美國總統川普特地發表談話。這種反應，顯然不是單純因為 DeepSeek 的技術表現，而是因為：它的成本低得驚人

長期以來，OpenAI、Google DeepMind、Meta、Anthropic 等科技公司都在投入巨額資金建構 AI 訓練基礎設施，因為 AI 競爭的門檻，被普遍認為是「資本+算力」。根據 Meta 內部員工透露： DeepSeek 訓練其模型的成本，甚至比不上 Meta 一位高階主管一年的薪水，而這類主管，Meta 至少有十幾個

更令人震撼的是 DeepSeek 的運行成本僅為主流 AI 模型的 2%，這意味著它不只是「稍微便宜」，而是「砍到只剩零頭」

這樣的結果，並非來自突破性的 AI 研究，而是來自一種業界早已知曉的技術策略：混合專家架構（Mixture of Experts, MoE）

MoE 的概念並不複雜。與傳統大型 AI 模型不同，MoE 並不會在每次運算時啟動所有參數，而是根據輸入的需求，動態選擇部分專家模型參與計算。這就像一間公司，並非所有員工都要參與每個專案，而是根據專長分配適合的專家處理特定問題，從而大幅降低運行成本

但如果 MoE 這麼簡單，為何 DeepSeek 是第一個真正將這一策略發揮到極致的公司？這才是讓矽谷技術圈與華爾街金融圈真正感到不安的地方，如果 AI 訓練成本能夠壓低到這種程度，那麼過去許多對 AI 市場的估值，是否還站得住腳呢？

▋真的便宜？還是另有隱情？

如果 DeepSeek 的低成本模式屬實，那麼不僅科技圈，連資本市場對 AI 的估值方式都將被顛覆。然而，這是否意味著我們看到了完整的真相？還是有些關鍵資訊被刻意忽略？

有分析指出，DeepSeek 可能低報了實際的訓練成本，其中一個關鍵疑點在於 Nvidia H100 晶片的使用量。有觀點認為，DeepSeek 可能擁有至少 50,000 片 H100 晶片，但未對外公開這個數據，藉此營造出「低成本訓練」的形象

此外，一些測試發現，DeepSeek 在處理長文本時可能存在算力不足的情況，這讓人懷疑他們是否在訓練階段進行了某些取捨，以降低計算資源的需求。然而，這樣的做法可能影響模型在長文本推理上的一致性與準確性

另一個值得關注的點是，DeepSeek 可能在訓練過程中採取了一些「捷徑」，以在有限的算力下訓練出高品質模型。其中 「知識蒸餾」（Knowledge Distillation） 就是一種可能的策略。這是一種讓較小的模型學習大型模型知識的方法，透過這種方式，他們可以大幅降低成本，同時保留大部分的模型效能

但無論真相如何，我們可以確定的是 DeepSeek 確實在降低成本上展現出了極為明顯的突破。而這種突破，勢必將為整個產業帶來巨大的變革，甚至可能重塑市場的競爭格局

▋市場效應：從成本降低到需求暴增

雖然市場上對於 DeepSeek 的成本統計仍有爭議，但毋庸置疑的是 DeepSeek 的出現顯著降低訓練和使用 AI 模型的成本。這項技術的突破使 AI 不再是僅限資金雄厚的大型企業專屬的高端工具，更多中小型企業甚至個人開發者也因此能夠負擔起使用成本

一個可以對應的例子是智慧手機的普及

在2000年代初，智慧手機因製造成本高昂，主要針對高端市場，售價也居高不下。然而，隨著硬體技術的不斷進步與生產規模的擴大，製造成本逐步降低，使智慧手機從一件昂貴的奢侈品，逐漸變為普通消費者也能輕鬆負擔的日常用品。雖然單台智慧手機的利潤因此變薄，但全球需求卻爆炸性增長

因此，整個產業的總體收益不僅未受影響，甚至實現了大幅增長。這一點在2010年代的中國市場尤為明顯，例如小米等品牌憑藉「低價高質」的策略快速擴大市場，最終依靠龐大的銷量實現了驚人的利潤

DeepSeek 帶來的市場效應與此有異曲同工之妙

隨著 AI 應用的門檻降低，各行各業都能利用 AI 提升產品和服務的價值。舉例來說，過去只有大型電商平台才能負擔高成本的 AI 訓練，用於開發精準的個性化推薦系統，幫助用戶在眾多商品中快速找到心儀的產品

然而，隨著 AI 訓練成本下降，這樣的技術不再是巨頭的專屬

未來，即使是小型網路商店也能使用 AI 技術打造專屬的推薦系統，例如針對顧客的購物紀錄與偏好提供貼心建議，甚至可以讓附近的咖啡店在外送平台上，為不同的顧客推薦他們最可能喜歡的飲品組合。這將使小型業者與大企業站在同一起跑線上，進一步促進市場的多樣化與活力

這樣的市場變化也帶來了一個不可忽視的現象：算力與電力需求的劇增

例如在數位廣告產業，隨著 AI 生成技術的成本下降，越來越多的公司將生成內容應用於廣告製作，從個性化影片到動態圖片，都能迅速生成。儘管 DeepSeek 提升了算力與電力的使用效率，但因需求激增，整體的算力與電力消耗不降反增。這種情況不僅發生在數位廣告領域，還能在醫療影像分析、自動化客服等領域觀察到。這些技術的快速普及，固然提升了效率與生產力，但同時也加劇了對基礎設施的壓力

▋市場效應：專用晶片的沒落

接下來，我們來探討一些較為負面的市場資訊。專為 Transformer 模型設計的專用晶片公司，可能會在這波技術浪潮中成為最大的受害者。以 Etched 公司為例，他們推出了名為 Sohu 的專用晶片，聲稱在大型語言模型的推理性能上，比 NVIDIA 的 H100 GPU 快 20 倍

然而，隨著 MoE 架構的興起，市場可能會重新評估對專用晶片的需求

MoE 模型透過結合多個專家網路，能夠在不同任務間靈活調度資源，提升效率。這種架構的彈性，使得通用GPU，如 NVIDIA 的 H100，仍具備競爭優勢，因為它們能夠適應多樣化的 AI 工作負載

因此，儘管專用晶片在特定應用上展現出色性能，但在市場趨勢的影響下，通用 GPU 可能仍是未來的主流選擇。專注於單一模型的專用晶片公司，可能需要重新思考其策略，以應對這種變化

▋未來產業變化的可能趨勢

本篇文章提到 DeepSeek 技術如何大幅降低 AI 訓練與使用成本，並探討這項技術變革可能帶來的市場影響。綜合這些觀點，我們可以預測幾個未來產業的重要趨勢

首先，算力需求將呈現出一種有趣的矛盾現象。一方面，隨著 AI 技術成本的下降，其應用將更加普及，推動對算力需求的持續增長；另一方面，技術進步使算力的使用效率顯著提高，也就是說，同樣的運算需求能以更少的資源完成

因此，隨著 AI 應用範圍擴大，整體算力需求不僅不會減少，反而會大幅增加

其次，能源產業也將面臨挑戰與機遇的並存。雖然 DeepSeek 等技術能降低每次運算的能耗，但由於總運算量的急速上升，能源消耗的總需求仍將顯著增長。這種趨勢為高效能電力基礎設施的發展提供新動力，同時也將催生更多能源相關創新的投資機會，對行業來說是一個重要的增長點

以上兩點對算力供應鏈的企業來說無疑是重大利好，但它們同時也對基礎設施的擴展與優化提出了更高的要求

再者，散熱技術可能成為未來十年內極為關鍵的產業之一。隨著 AI 應用的廣泛普及，無論是資料中心還是邊緣運算裝置，高效散熱解決方案的需求將同步上升。散熱技術的創新不僅是解決硬體瓶頸的關鍵，還將成為高度競爭的市場領域，吸引更多企業投入資源

然而，這一趨勢對某些專用晶片設計公司來說卻未必是好消息。隨著 MoE 架構逐漸成為 AI 訓練的主流，通用GPU 晶片（如 NVIDIA 的 H100）憑藉其多樣性與靈活性，將繼續主導市場。相比之下，那些專為單一模型設計的晶片公司，可能因需求減少而面臨嚴峻挑戰

回顧華爾街對這波技術變革的反應，不難發現恐慌情緒的背後更多是投機者的不安，以及部分專家煽動下的市場波動。這些擔憂往往聚焦於短期影響，而忽略了長期趨勢中的結構性機會

無論是算力、能源還是散熱技術，這些產業都將伴隨 AI 的普及迎來新一輪增長浪潮。能否把握這些關鍵趨勢，將成為未來企業與市場成功與否的分水嶺

＊再次強調：本人是8zz等級的股海冥燈，因此本文不構成任何投資建議！！

▋筆者思考

長久以來，中國產業以「應用為王」的特性著稱，展現出在內捲與成本優化方面的無與倫比的能力

然而，這種強調效率與成本競爭的模式，在某種程度上也限制了中國在產業創新上的發展潛力。從科技研發到基礎技術的突破，中國往往更擅長將現有技術落地並快速推廣，而非在原始創新上領先

相較之下，美國在 AI 創新領域的領先地位依然無可挑戰

不論是技術框架的提出，還是基礎模型的研發，美國始終站在全球科技前沿。這樣的優勢不僅來自龐大的資本支持，還得益於自由的學術環境與多樣化的創業生態系統。未來，全球最重要的 AI 創新依然極有可能由美國主導

然而，DeepSeek 的突破卻像是一記當頭棒喝，提醒著美國的科技領域：僅靠高成本的創新是否足以支撐整個產業的長遠發展？

DeepSeek 的成功，不僅僅是技術上的勝利，更是一個關於「如何讓技術落地」的典範。它迫使投資者重新審視：在追求技術前沿的同時，我們是否忽略了讓創新技術以合理成本與價格進入市場的重要性？

產業創新的目的，最終還是要服務於市場與大眾。DeepSeek 提醒我們，科技進步不僅需要突破性的創新，也需要能支撐產業健康循環的經濟模式。這一點，或許將在未來的全球競爭中變得越來越關鍵

留言

水源駝哥 / 科技導讀與應用思考

4會員

14內容數

因為長得像駱駝（？）所以叫駝哥！? 台大生醫電資所博士，在兩間小公司擔任執行長與技術長。對生物醫學、電子電機、微流體、半導體、生物資訊等領域都是略懂略懂。這裡會專注分享我對科技議題的科普與個人思考，沒什麼破規矩，不要惡意攻擊任何人就好！如果你有感興趣的主題請留言讓我知道，讓我有多水幾篇文章的機會！

水源駝哥 / 科技導讀與應用思考的其他內容

2025/02/15

總覺得咖啡太苦嗎？基因影響你的個人品味

討厭香菜或咖啡苦味，可能是基因造成的！研究發現，OR6A2基因變異使部分人對香菜中的醛類化合物敏感，產生肥皂味錯覺；而TAS2R基因變異則讓部分人對咖啡苦味超敏感。別再覺得自己挑食或不懂品味，這可能都是基因註定！

2025/02/15

總覺得咖啡太苦嗎？基因影響你的個人品味

2025/01/31

英偉達跌落神壇！星際之門將淪為騙局嗎？

DeepSeek的成功並未降低算力需求，而是凸顯了AI產業的成本優化和本地化趨勢。本文探討DeepSeek的成功關鍵、算力軍備競賽的可能性及英偉達面臨的真正挑戰，包含AI模型發展路徑的差異、AI產品化的趨勢以及專用AI晶片的興起。

2025/01/31

英偉達跌落神壇！星際之門將淪為騙局嗎？

2025/01/24

當AI學會「欺騙」人類：隱瞞性策略將為世界帶來浩劫

大型語言模型的策略性欺瞞行為日益成為關注焦點，此文探討AI模型如何隱藏其能力、目標，甚至操縱情境以達成目標，並分析其背後原因與潛在風險。研究者警告此趨勢可能導致『欺騙增強循環』，造成難以控制的風險，並呼籲重新審視AI的監督與控制框架。

2025/01/24

當AI學會「欺騙」人類：隱瞞性策略將為世界帶來浩劫

看更多

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇：帕拉贊諾夫的十段殘篇》，如何以十段殘篇，結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭，探討藝術在儀式消失的現代社會如何承接意義，並展現不羈的自由靈魂。

#釀電影#釀評論#藝術評論

2026/02/11

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

#釀電影#釀評論#藝術評論

2026/02/11

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11