深度求索 DeepSeek:低成本AI模型引發的產業變革與未來趨勢預測

更新於 發佈於 閱讀時間約 12 分鐘
投資理財內容聲明

先說結論:我認為目前華爾街過度恐慌 (人為製造買點?);矽谷會重新思考成本優化的重要性。本篇文章只探討個人理性認為的產業現狀,不構成任何投資建議,因為資本市場很多時候是不理性的

 

▋橫空出世的 DeepSeek 與產業動盪

 

先簡單說明一下本文背景。近期,一家名為DeepSeek的中國人工智慧(AI)初創公司橫空出世,迅速引起全球關注

 

該公司近期推出的AI模型DeepSeek-R1,以僅約600萬美元的低成本開發,且在高端晶片的數量受到限制的情況下,性能卻可與美國領先的AI模型媲美。這一突破不僅震撼了矽谷,也在華爾街引發了巨大波動

 

DeepSeek的崛起導致美國主要科技股市值大幅縮水,單日蒸發近1兆美元。其中,Nvidia股價下跌17%,創下歷史新高,其他科技巨頭如微軟、特斯拉等也受到波及

 

美國總統川普也表示,DeepSeek的出現應該成為美國企業的「警鐘」,敦促它們加強在AI領域的競爭力。同時,市場分析師也在討論DeepSeek的成功是否會對矽谷產生正面影響,迫使其以更低的成本進行創新

 

(圖) 中國 AI 模型 DeepSeek 深度求索

(圖) 中國 AI 模型 DeepSeek 深度求索


▋DeepSeek 如何引發矽谷大地震?

 

最近,社群媒體與科技網站上充斥著各種關於 DeepSeek 的測評文章,許多評測認為,它的性能與 OpenAI 的GPT-o1 相當,甚至有些認為 o1 模型略勝一籌

 

如果 DeepSeek 只是在性能上接近 GPT-o1,那麼它可能只是中國 AI 產業的又一個「大外宣」產品。然而,這家原本默默無聞的小公司,卻讓矽谷的科技巨頭震驚,甚至引發美國總統川普特地發表談話。這種反應,顯然不是單純因為 DeepSeek 的技術表現,而是因為:它的成本低得驚人

 

長期以來,OpenAI、Google DeepMind、Meta、Anthropic 等科技公司都在投入巨額資金建構 AI 訓練基礎設施,因為 AI 競爭的門檻,被普遍認為是「資本+算力」。根據 Meta 內部員工透露: DeepSeek 訓練其模型的成本,甚至比不上 Meta 一位高階主管一年的薪水,而這類主管,Meta 至少有十幾個


更令人震撼的是 DeepSeek 的運行成本僅為主流 AI 模型的 2%,這意味著它不只是「稍微便宜」,而是「砍到只剩零頭」

 

這樣的結果,並非來自突破性的 AI 研究,而是來自一種業界早已知曉的技術策略:混合專家架構(Mixture of Experts, MoE)

 

MoE 的概念並不複雜。與傳統大型 AI 模型不同,MoE 並不會在每次運算時啟動所有參數,而是根據輸入的需求,動態選擇部分專家模型參與計算。這就像一間公司,並非所有員工都要參與每個專案,而是根據專長分配適合的專家處理特定問題,從而大幅降低運行成本

 

但如果 MoE 這麼簡單,為何 DeepSeek 是第一個真正將這一策略發揮到極致的公司?這才是讓矽谷技術圈與華爾街金融圈真正感到不安的地方,如果 AI 訓練成本能夠壓低到這種程度,那麼過去許多對 AI 市場的估值,是否還站得住腳呢?

 

▋真的便宜?還是另有隱情?

 

如果 DeepSeek 的低成本模式屬實,那麼不僅科技圈,連資本市場對 AI 的估值方式都將被顛覆。然而,這是否意味著我們看到了完整的真相?還是有些關鍵資訊被刻意忽略?

 

有分析指出,DeepSeek 可能低報了實際的訓練成本,其中一個關鍵疑點在於 Nvidia H100 晶片的使用量。有觀點認為,DeepSeek 可能擁有至少 50,000 片 H100 晶片,但未對外公開這個數據,藉此營造出「低成本訓練」的形象

 

此外,一些測試發現,DeepSeek 在處理長文本時可能存在算力不足的情況,這讓人懷疑他們是否在訓練階段進行了某些取捨,以降低計算資源的需求。然而,這樣的做法可能影響模型在長文本推理上的一致性與準確性

 

另一個值得關注的點是,DeepSeek 可能在訓練過程中採取了一些「捷徑」,以在有限的算力下訓練出高品質模型。其中 「知識蒸餾」(Knowledge Distillation) 就是一種可能的策略。這是一種讓較小的模型學習大型模型知識的方法,透過這種方式,他們可以大幅降低成本,同時保留大部分的模型效能

 

但無論真相如何,我們可以確定的是 DeepSeek 確實在降低成本上展現出了極為明顯的突破。而這種突破,勢必將為整個產業帶來巨大的變革,甚至可能重塑市場的競爭格局

 

市場效應:從成本降低到需求暴增

 

雖然市場上對於 DeepSeek 的成本統計仍有爭議,但毋庸置疑的是 DeepSeek 的出現顯著降低訓練和使用 AI 模型的成本。這項技術的突破使 AI 不再是僅限資金雄厚的大型企業專屬的高端工具,更多中小型企業甚至個人開發者也因此能夠負擔起使用成本

 

一個可以對應的例子是智慧手機的普及

 

在2000年代初,智慧手機因製造成本高昂,主要針對高端市場,售價也居高不下。然而,隨著硬體技術的不斷進步與生產規模的擴大,製造成本逐步降低,使智慧手機從一件昂貴的奢侈品,逐漸變為普通消費者也能輕鬆負擔的日常用品。雖然單台智慧手機的利潤因此變薄,但全球需求卻爆炸性增長

 

因此,整個產業的總體收益不僅未受影響,甚至實現了大幅增長。這一點在2010年代的中國市場尤為明顯,例如小米等品牌憑藉「低價高質」的策略快速擴大市場,最終依靠龐大的銷量實現了驚人的利潤

 

DeepSeek 帶來的市場效應與此有異曲同工之妙

 

隨著 AI 應用的門檻降低,各行各業都能利用 AI 提升產品和服務的價值。舉例來說,過去只有大型電商平台才能負擔高成本的 AI 訓練,用於開發精準的個性化推薦系統,幫助用戶在眾多商品中快速找到心儀的產品

 

然而,隨著 AI 訓練成本下降,這樣的技術不再是巨頭的專屬

 

未來,即使是小型網路商店也能使用 AI 技術打造專屬的推薦系統,例如針對顧客的購物紀錄與偏好提供貼心建議,甚至可以讓附近的咖啡店在外送平台上,為不同的顧客推薦他們最可能喜歡的飲品組合。這將使小型業者與大企業站在同一起跑線上,進一步促進市場的多樣化與活力

 

這樣的市場變化也帶來了一個不可忽視的現象:算力與電力需求的劇增

 

例如在數位廣告產業,隨著 AI 生成技術的成本下降,越來越多的公司將生成內容應用於廣告製作,從個性化影片到動態圖片,都能迅速生成。儘管 DeepSeek 提升了算力與電力的使用效率,但因需求激增,整體的算力與電力消耗不降反增。這種情況不僅發生在數位廣告領域,還能在醫療影像分析、自動化客服等領域觀察到。這些技術的快速普及,固然提升了效率與生產力,但同時也加劇了對基礎設施的壓力

 

市場效應:專用晶片的沒落

 

接下來,我們來探討一些較為負面的市場資訊。專為 Transformer 模型設計的專用晶片公司,可能會在這波技術浪潮中成為最大的受害者。以 Etched 公司為例,他們推出了名為 Sohu 的專用晶片,聲稱在大型語言模型的推理性能上,比 NVIDIA 的 H100 GPU 快 20 倍

 

然而,隨著 MoE 架構的興起,市場可能會重新評估對專用晶片的需求

 

MoE 模型透過結合多個專家網路,能夠在不同任務間靈活調度資源,提升效率。 這種架構的彈性,使得通用GPU,如 NVIDIA 的 H100,仍具備競爭優勢,因為它們能夠適應多樣化的 AI 工作負載

 

因此,儘管專用晶片在特定應用上展現出色性能,但在市場趨勢的影響下,通用 GPU 可能仍是未來的主流選擇。專注於單一模型的專用晶片公司,可能需要重新思考其策略,以應對這種變化

 

▋未來產業變化的可能趨勢

 

本篇文章提到 DeepSeek 技術如何大幅降低 AI 訓練與使用成本,並探討這項技術變革可能帶來的市場影響。綜合這些觀點,我們可以預測幾個未來產業的重要趨勢

 

首先,算力需求將呈現出一種有趣的矛盾現象。一方面,隨著 AI 技術成本的下降,其應用將更加普及,推動對算力需求的持續增長;另一方面,技術進步使算力的使用效率顯著提高,也就是說,同樣的運算需求能以更少的資源完成

 

因此,隨著 AI 應用範圍擴大,整體算力需求不僅不會減少,反而會大幅增加

 

其次,能源產業也將面臨挑戰與機遇的並存。雖然 DeepSeek 等技術能降低每次運算的能耗,但由於總運算量的急速上升,能源消耗的總需求仍將顯著增長。這種趨勢為高效能電力基礎設施的發展提供新動力,同時也將催生更多能源相關創新的投資機會,對行業來說是一個重要的增長點

 

以上兩點對算力供應鏈的企業來說無疑是重大利好,但它們同時也對基礎設施的擴展與優化提出了更高的要求

 

再者,散熱技術可能成為未來十年內極為關鍵的產業之一。隨著 AI 應用的廣泛普及,無論是資料中心還是邊緣運算裝置,高效散熱解決方案的需求將同步上升。散熱技術的創新不僅是解決硬體瓶頸的關鍵,還將成為高度競爭的市場領域,吸引更多企業投入資源

 

然而,這一趨勢對某些專用晶片設計公司來說卻未必是好消息。隨著 MoE 架構逐漸成為 AI 訓練的主流,通用GPU 晶片(如 NVIDIA 的 H100)憑藉其多樣性與靈活性,將繼續主導市場。相比之下,那些專為單一模型設計的晶片公司,可能因需求減少而面臨嚴峻挑戰

 

回顧華爾街對這波技術變革的反應,不難發現恐慌情緒的背後更多是投機者的不安,以及部分專家煽動下的市場波動。這些擔憂往往聚焦於短期影響,而忽略了長期趨勢中的結構性機會

 

無論是算力、能源還是散熱技術,這些產業都將伴隨 AI 的普及迎來新一輪增長浪潮。能否把握這些關鍵趨勢,將成為未來企業與市場成功與否的分水嶺

 

*再次強調:本人是8zz等級的股海冥燈,因此本文不構成任何投資建議!!

 

▋筆者思考

 

長久以來,中國產業以「應用為王」的特性著稱,展現出在內捲與成本優化方面的無與倫比的能力

 

然而,這種強調效率與成本競爭的模式,在某種程度上也限制了中國在產業創新上的發展潛力。從科技研發到基礎技術的突破,中國往往更擅長將現有技術落地並快速推廣,而非在原始創新上領先

 

相較之下,美國在 AI 創新領域的領先地位依然無可挑戰

 

不論是技術框架的提出,還是基礎模型的研發,美國始終站在全球科技前沿。這樣的優勢不僅來自龐大的資本支持,還得益於自由的學術環境與多樣化的創業生態系統。未來,全球最重要的 AI 創新依然極有可能由美國主導

 

然而,DeepSeek 的突破卻像是一記當頭棒喝,提醒著美國的科技領域:僅靠高成本的創新是否足以支撐整個產業的長遠發展?

 

DeepSeek 的成功,不僅僅是技術上的勝利,更是一個關於「如何讓技術落地」的典範。它迫使投資者重新審視:在追求技術前沿的同時,我們是否忽略了讓創新技術以合理成本與價格進入市場的重要性?

 

產業創新的目的,最終還是要服務於市場與大眾。DeepSeek 提醒我們,科技進步不僅需要突破性的創新,也需要能支撐產業健康循環的經濟模式。這一點,或許將在未來的全球競爭中變得越來越關鍵

留言
avatar-img
留言分享你的想法!
avatar-img
水源駝哥 / 科技導讀與應用思考
4會員
14內容數
因為長得像駱駝(?)所以叫駝哥!? 台大生醫電資所博士,在兩間小公司擔任執行長與技術長。 對生物醫學、電子電機、微流體、半導體、生物資訊等領域都是略懂略懂。 這裡會專注分享我對科技議題的科普與個人思考,沒什麼破規矩,不要惡意攻擊任何人就好!如果你有感興趣的主題請留言讓我知道,讓我有多水幾篇文章的機會!
2025/02/15
討厭香菜或咖啡苦味,可能是基因造成的!研究發現,OR6A2基因變異使部分人對香菜中的醛類化合物敏感,產生肥皂味錯覺;而TAS2R基因變異則讓部分人對咖啡苦味超敏感。別再覺得自己挑食或不懂品味,這可能都是基因註定!
Thumbnail
2025/02/15
討厭香菜或咖啡苦味,可能是基因造成的!研究發現,OR6A2基因變異使部分人對香菜中的醛類化合物敏感,產生肥皂味錯覺;而TAS2R基因變異則讓部分人對咖啡苦味超敏感。別再覺得自己挑食或不懂品味,這可能都是基因註定!
Thumbnail
2025/01/31
DeepSeek的成功並未降低算力需求,而是凸顯了AI產業的成本優化和本地化趨勢。本文探討DeepSeek的成功關鍵、算力軍備競賽的可能性及英偉達面臨的真正挑戰,包含AI模型發展路徑的差異、AI產品化的趨勢以及專用AI晶片的興起。
Thumbnail
2025/01/31
DeepSeek的成功並未降低算力需求,而是凸顯了AI產業的成本優化和本地化趨勢。本文探討DeepSeek的成功關鍵、算力軍備競賽的可能性及英偉達面臨的真正挑戰,包含AI模型發展路徑的差異、AI產品化的趨勢以及專用AI晶片的興起。
Thumbnail
2025/01/24
大型語言模型的策略性欺瞞行為日益成為關注焦點,此文探討AI模型如何隱藏其能力、目標,甚至操縱情境以達成目標,並分析其背後原因與潛在風險。研究者警告此趨勢可能導致『欺騙增強循環』,造成難以控制的風險,並呼籲重新審視AI的監督與控制框架。
Thumbnail
2025/01/24
大型語言模型的策略性欺瞞行為日益成為關注焦點,此文探討AI模型如何隱藏其能力、目標,甚至操縱情境以達成目標,並分析其背後原因與潛在風險。研究者警告此趨勢可能導致『欺騙增強循環』,造成難以控制的風險,並呼籲重新審視AI的監督與控制框架。
Thumbnail
看更多
你可能也想看
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
DeepSeek 以低成本開發高效能 AI,導致市場質疑 AI 半導體投資效益,進而影響 NVIDIA 股價,單日市值蒸發 900 億美元。。DeepSeek 的崛起讓投資者重新評估 AI 投資策略,可能促進技術創新與半導體需求,美國科技巨頭仍持續加碼 AI 領域投資。
Thumbnail
DeepSeek 以低成本開發高效能 AI,導致市場質疑 AI 半導體投資效益,進而影響 NVIDIA 股價,單日市值蒸發 900 億美元。。DeepSeek 的崛起讓投資者重新評估 AI 投資策略,可能促進技術創新與半導體需求,美國科技巨頭仍持續加碼 AI 領域投資。
Thumbnail
近期,DeepSeek V3的出現引爆了全球科技業和矽谷的恐慌,直接嚇壞 Meta! 除了各項數據的表現不俗,最關鍵的,是這個來自中國血統,可與 ChatGPT 抗衡的 DeepSeek, 其最新AI模組 V3 只花了557萬美元訓練,甚至比美國科技業某些高管的年薪還低...
Thumbnail
近期,DeepSeek V3的出現引爆了全球科技業和矽谷的恐慌,直接嚇壞 Meta! 除了各項數據的表現不俗,最關鍵的,是這個來自中國血統,可與 ChatGPT 抗衡的 DeepSeek, 其最新AI模組 V3 只花了557萬美元訓練,甚至比美國科技業某些高管的年薪還低...
Thumbnail
中國AI新創公司DeepSeek推出全新AI訓練模組,成本低於Open AI的ChatGPT,引發美國科技股震盪。本文分析DeepSeek的背景、技術來源、成本效益以及對AI產業和美國科技巨頭的影響,並探討其對AI普及化的促進作用和對晶片產業的衝擊。
Thumbnail
中國AI新創公司DeepSeek推出全新AI訓練模組,成本低於Open AI的ChatGPT,引發美國科技股震盪。本文分析DeepSeek的背景、技術來源、成本效益以及對AI產業和美國科技巨頭的影響,並探討其對AI普及化的促進作用和對晶片產業的衝擊。
Thumbnail
摘要 摩根士丹利的最新報告針對深度學習模型DeepSeek的影響進行了深入分析,並重申了對人工智慧(AI)晶片市場的樂觀看法。報告中提到,儘管美國雲服務提供商(CSPs)維持了相似的AI資本支出,但對中國AI市場和聯發科的看法更加積極。此外,報告強調了DeepSeek在降低成本方面的潛力,並指出N
Thumbnail
摘要 摩根士丹利的最新報告針對深度學習模型DeepSeek的影響進行了深入分析,並重申了對人工智慧(AI)晶片市場的樂觀看法。報告中提到,儘管美國雲服務提供商(CSPs)維持了相似的AI資本支出,但對中國AI市場和聯發科的看法更加積極。此外,報告強調了DeepSeek在降低成本方面的潛力,並指出N
Thumbnail
最近,中國AI新創公司DeepSeek推出了一款低成本的開源大型語言模型,聲稱性能可媲美美國的ChatGPT。恰恰引發了美國半導體股價,尤其有輝達(NVIDIA)與台積電ADR雙雙大跌,引發市場恐慌,美股要GG了嗎? 今天,就讓我們透過這個案例,重新探討 指數投資與分散風險的核心概念!
Thumbnail
最近,中國AI新創公司DeepSeek推出了一款低成本的開源大型語言模型,聲稱性能可媲美美國的ChatGPT。恰恰引發了美國半導體股價,尤其有輝達(NVIDIA)與台積電ADR雙雙大跌,引發市場恐慌,美股要GG了嗎? 今天,就讓我們透過這個案例,重新探討 指數投資與分散風險的核心概念!
Thumbnail
近期,中國新創公司Deepseek發表了 DeepSeek- V3 和 DeepSeek- R1 兩款模型,據報導指出,其性能與Open AI相當;此報導一出,Nvidia等相關公司股價陸續出現重挫;究竟Deepseek是什麼公司?為何會讓全球為之震撼?而後又會造成什麼影響?
Thumbnail
近期,中國新創公司Deepseek發表了 DeepSeek- V3 和 DeepSeek- R1 兩款模型,據報導指出,其性能與Open AI相當;此報導一出,Nvidia等相關公司股價陸續出現重挫;究竟Deepseek是什麼公司?為何會讓全球為之震撼?而後又會造成什麼影響?
Thumbnail
DeepSeek AI助手的誕生:顛覆性科技引爆市場關注 市場焦點: 美國科技股與亞洲市場反應劇烈,特別是隨著中國科技新秀DeepSeek公司正式推出一款高性價比的AI助手,市場情緒開始轉向。這一創新引發投資者重新思考人工智慧產業的營收模式及其對高端晶片需求的依賴程度。 週一,納斯達克100指
Thumbnail
DeepSeek AI助手的誕生:顛覆性科技引爆市場關注 市場焦點: 美國科技股與亞洲市場反應劇烈,特別是隨著中國科技新秀DeepSeek公司正式推出一款高性價比的AI助手,市場情緒開始轉向。這一創新引發投資者重新思考人工智慧產業的營收模式及其對高端晶片需求的依賴程度。 週一,納斯達克100指
Thumbnail
中國的 DeepSeek-R1 模型,居然只用 1/30 成本,打造出堪比 O1 模型效能,也掀起市場對硬體需求擔憂,甚至引發美股半導體硬體大跌。但與此同時,掌握終端通路、軟體的廠商,股價反而逆勢上漲。 本文將會分享,在 AI 軟體應用爆發的 2025 年,該如何投資美股題材?ETF 怎麼選?
Thumbnail
中國的 DeepSeek-R1 模型,居然只用 1/30 成本,打造出堪比 O1 模型效能,也掀起市場對硬體需求擔憂,甚至引發美股半導體硬體大跌。但與此同時,掌握終端通路、軟體的廠商,股價反而逆勢上漲。 本文將會分享,在 AI 軟體應用爆發的 2025 年,該如何投資美股題材?ETF 怎麼選?
Thumbnail
中國開源AI公司DeepSeek免費APP下載排名第一,半導體承壓,短線上債券表現,但預計AI軟體公司、記憶體在市場壓力後仍見機會。AMD宣布已將全新的 DeepSeek-V3 模型整合至其 GPU,市場關注AI算力與晶片競爭變化。市場維持中性偏強,震盪調節並有修正。本週科技巨頭財報及美國利率會議。
Thumbnail
中國開源AI公司DeepSeek免費APP下載排名第一,半導體承壓,短線上債券表現,但預計AI軟體公司、記憶體在市場壓力後仍見機會。AMD宣布已將全新的 DeepSeek-V3 模型整合至其 GPU,市場關注AI算力與晶片競爭變化。市場維持中性偏強,震盪調節並有修正。本週科技巨頭財報及美國利率會議。
Thumbnail
 DeepSeek的事件解讀與評論對美股影響 近日DeepSeek 的推出在市場掀起一波熱議,作為一個僅耗資 560 萬美元完成的開源大型語言模型,DeepSeek 展現了低成本與快速開發的優勢,其成果被部分人視為對 OpenAI 和 Google 壟斷地位的潛在挑戰。
Thumbnail
 DeepSeek的事件解讀與評論對美股影響 近日DeepSeek 的推出在市場掀起一波熱議,作為一個僅耗資 560 萬美元完成的開源大型語言模型,DeepSeek 展現了低成本與快速開發的優勢,其成果被部分人視為對 OpenAI 和 Google 壟斷地位的潛在挑戰。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News