DeepSeek在AI技術上的創新(例如使用大型混合專家模型MoE及「推理型」大模型)讓其AI系統能以更少資源達到與現有頂尖模型相當的效果。据報導,DeepSeek-R1模型的使用成本比OpenAI同級模型低20到50倍
。DeepSeek團隊透露,其DeepSeek-V3模型在2024年僅耗費約600萬美元、使用NVIDIA H800 GPU完成訓練(遠低於OpenAI或Alphabet投入的數十億美元),顯示出他們透過技術突破大幅降低了算力需求。然而,這是否意味著對NVIDIA GPU需求的下降還有爭議。有分析認為,如果AI模型能以更少資料和計算完成訓練,可能意味著對晶片和大型資料中心的需求會減少
但另一方面,DeepSeek的成功其實是建立在大量運算資源之上。據SemiAnalysis分析,DeepSeek背後的公司實際上部署了約50,000顆NVIDIA GPU,硬體投入高達16億美元。也就是說,DeepSeek表面上的「低資源」是透過高效技術利用大規模GPU計算達成的,而非完全不需要GPU。
此外,DeepSeek的旗艦模型R1規模龐大(6710億參數的MoE模型),採用了連續多輪推理來提高答案品質。這種測試時推理(test-time scaling)的做法需要模型在推理時進行多次推演搜索,雖提高了效果但也顯著增加計算量
。NVIDIA指出,像DeepSeek-R1這樣的推理模型要實現即時回答,需要大量GPU並行運算;例如完整運行R1模型實時生成結果,單台伺服器可能需要8顆高端H200 GPU協同處理。可見,即使DeepSeek透過模型壓縮和蒸餾推出了1.5億至700億參數不等的六種小型學生模型,可在PC級別硬體上運行
“深度推理”本身對硬體加速的需求仍然很高。因此,DeepSeek的技術創新一方面提高了AI計算效率(每項任務所需的GPU資源可能下降),但另一方面也拓寬了GPU的應用範疇(更多終端設備也需要GPU來運行先進AI)。總體而言,DeepSeek並沒有削弱對NVIDIA GPU的需求:大型模型的訓練依然離不開大量GPU支持,而多步推理的模型在推理階段反而需要更強的算力來保證性能
。未來我們可能看到GPU需求的結構轉變——相對於過去集中於巨型訓練,推理端的GPU需求比重提高,但NVIDIA產品在這兩方面都仍是核心支柱。
DeepSeek的出現也可能對NVIDIA未來技術路線帶來影響。首先,NVIDIA已迅速將DeepSeek-R1整合到自家軟體生態中:例如透過NVIDIA NIM微服務提供DeepSeek-R1模型預覽,讓企業客戶能在NVIDIA加速平台上部署這一新模型
。這表明NVIDIA樂於支持這類新型「推理型」AI模型,並調整其軟硬體方案以適應這種趨勢。在硬體方面,DeepSeek-R1採用了極端的MoE架構和超長上下文(128k tokens),這需要GPU具備超高計算吞吐和高速連接能力。NVIDIA最新一代的Hopper架構(如H100、H200)以及即將問世的Blackwell架構(GeForce RTX 50系列)正好朝這方向發展——它們配備了先進的張量核心(支援FP8等低精度計算)和NVLink高速互連,可滿足MoE模型巨量資料交換和計算需求
事實上,NVIDIA官方強調,使用Hopper架構的FP8運算和900GB/s的NVLink帶寬,才能讓單台8卡伺服器跑起DeepSeek-R1全模型並達到每秒近3872個token的生成速度,這些技術動向(如更低精度的運算支持、更快的GPU直連通信)與DeepSeek所代表的模型趨勢是契合的。
未來,隨著推理時間計算(即模型在回答時進行較多“思考”)成為提升AI能力的重要手段,NVIDIA很可能在架構設計上繼續向優化推理效能傾斜。例如,增強GPU對多步推理、agent式AI的支援,在軟體上推出更完善的工具加速Chain-of-Thought推理過程等。NVIDIA執行長黃仁勳也在近期財報電話會議上表示,這類創新推理策略其實有利於所有AI晶片供應商,NVIDIA已從中受益
——也就是說,模型越是強調推理階段的運算,對高效能晶片的需求就越大,這正對應了NVIDIA產品的強項。除了數據中心,NVIDIA也注意到將強大AI模型下放到個人設備的潮流。DeepSeek透過蒸餾讓部分模型可以在PC上本地運行,NVIDIA順勢推出了所謂「RTX AI PC」的概念,用最新的GeForce RTX 50系列來加速這些本地AI應用。
這表示NVIDIA的技術方向正變得更全面:既要在雲端提供頂級算力支持超大模型,也要讓消費級GPU具備足夠AI運算能力,滿足一般開發者和用戶在本地運行先進AI的需求。
綜上,DeepSeek帶來的技術變革趨勢(如大參數MoE、多輪推理、小模型蒸餾等)其實都在NVIDIA的研發版圖之內,並將加速NVIDIA在這些領域的投入。NVIDIA會繼續朝著更高效的訓練和更強大的推理兩端發展,以確保無論AI模型如何演進(更大還是更巧妙),都離不開NVIDIA的加速計算平台。
在AI市場格局上,DeepSeek的崛起對NVIDIA的競爭地位產生了一定影響,但主要體現在生態和需求格局上,而非直接的硬體競爭。DeepSeek作為一家提供AI模型與服務的新創,其免費AI助理上線後迅速走紅:上週上線後不久即登上蘋果App Store下載榜首,下載量超過了美國的競爭對手ChatGPT
。這表明在AI應用層面,DeepSeek正對OpenAI等現有領導者造成衝擊,可能改變AI服務的競爭版圖。然而,NVIDIA本身並不提供最終的聊天機器人服務,它是AI算力供應商。因此DeepSeek的成功未必削弱NVIDIA的市場地位,反而可能以不同方式強化NVIDIA在AI產業中的核心角色。
首先,DeepSeek並沒有削減對NVIDIA硬體的依賴——相反,它的大模型訓練和運營建立在NVIDIA GPU之上。據報導,DeepSeek及其資金支持方大量採購了NVIDIA的H800和H100 GPU來建設自有資料中心,保有的Hopper架構GPU數量高達五萬顆
。這意味著即便AI服務市場出現新玩家,NVIDIA仍是幕後贏家:DeepSeek越成功、用戶越多,為支撐其服務運行所需要的NVIDIA硬體也就越多。因此在AI訓練/推理基礎設施市場,NVIDIA的地位短期內不會因DeepSeek而被動搖。事實上,NVIDIA目前在資料中心AI加速晶片領域據估計仍握有約九成的市佔率
DeepSeek等新創並未帶來可替代NVIDIA GPU的硬體方案,所以NVIDIA在這一市場中的壟斷地位依舊穩固。其次,DeepSeek的模式若被證明可行,可能會引發更多競爭對手加入效仿,從而改變AI訓練與部署的市場生態。例如,OpenAI、Google、Meta等大廠可能會加速研發自身的高效推理型模型以維持競爭力;更多初創企業也可能嘗試以較小預算訓練專門模型來滿足特定領域需求。這將使AI模型市場更加百花齊放,不再只依賴少數幾個超大模型。對NVIDIA而言,這既是機遇也是挑戰:機遇在於更多的AI團隊投入研發意味著更多的GPU採購需求,但挑戰在於如果未來很多任務都可由某一兩個通用模型(如DeepSeek-R1)提供,產業對重複訓練新模型的需求可能減少。換言之,NVIDIA可能少了一些來自「每個大公司各訓練一個GPT」的訂單,但會多出來自各種創新應用部署的訂單。總體看,NVIDIA在AI訓練和推理基礎設備市場的主導地位目前仍然穩固,而且其戰略靈活:不論哪個AI模型勝出,NVIDIA都確保該模型需要運行在自家加速器上。因此DeepSeek帶來的是AI應用層面的競爭變化,硬體層面的競爭格局暫時未因其改變。
值得一提的是,有觀點指出DeepSeek專注於手機和PC等終端的AI應用,而非數據中心,因而對NVIDIA核心業務的衝擊有限。資深投資經理Daniel Morgan就認為,DeepSeek的模型主打手機/PC端助手,而真正造就巨大收益的AI市場仍在雲端資料中心晶片,這部分依然是NVIDIA的強項。
從這點看,DeepSeek拓展了AI應用場景,但NVIDIA在雲端高階AI加速上的壟斷優勢未改變。不過,NVIDIA也需要關注AI市場可能的變化趨勢,例如推理工作負載從雲向端分散。總之,目前DeepSeek對NVIDIA競爭地位的影響更多是在提醒NVIDIA:AI計算的需求結構可能演進,但NVIDIA透過技術和市場布局,有能力在新的格局中繼續保持領先。
DeepSeek的出現對NVIDIA的企業客戶和合作關係也產生了一定影響。許多企業原本可能考慮自行訓練大型語言模型或採購雲端AI服務,但現在有了DeepSeek提供的低成本現成模型,這些企業可能改為使用DeepSeek的模型來開發應用。短期看,這可能減少部分企業自行建設AI基礎設施的意願,從而稍微影響NVIDIA相關GPU的直接需求(因為那些企業不再從零開始訓練模型了)。正如分析師所言,DeepSeek高效模型的出現,讓市場意識到或許不需要那麼多晶片和超大算力中心也能達成AI目標。這種觀點如果被企業接受,可能轉化為較為保守的硬體採購策略。
然而,同樣多數觀點認為這種影響是有限且可轉化的
首先,企業使用DeepSeek模型並不意味著不需要GPU。相反,許多企業若想在內部部署或微調DeepSeek的模型,仍需要購買NVIDIA GPU來支援推理和訓練(微調)工作。例如,NVIDIA已將DeepSeek-R1封裝為NVIDIA AI Enterprise套件中的微服務供企業使用,企業若要在自有基礎設施上跑這個模型,需要相應的NVIDIA加速硬體支持。這其實轉變了NVIDIA的商業模式:從賣GPU給每個訓練自己模型的客戶,轉為賣GPU給想部署通用模型(如DeepSeek-R1)的客戶。NVIDIA依然能透過與DeepSeek這類模型提供者合作,來服務廣大終端客戶的需求。事實上,NVIDIA正在成為AI產業的「水電公司」:不論企業選擇哪家的AI模型,最終都需要NVIDIA來提供算力底座。
在市場佔有率方面,NVIDIA在AI加速器領域的主導地位目前看來沒有因DeepSeek而下降。
數據顯示,截至2024年底NVIDIA大約佔據AI運算晶片九成的市場份額。DeepSeek並沒有引入新的硬體競爭者來瓜分這個市場;相反,它本身就是NVIDIA硬體的消費者。所以NVIDIA的市場份額不僅未被蠶食,還可能因為DeepSeek帶動的AI熱潮在某些市場(如中國)而進一步擴大。需要注意的是,DeepSeek作為中國的AI新創,成功後可能促使中國更多企業投入生成式AI應用,這將提高對GPU的總需求。然而,美中技術管制的因素也需考量:由於高階NVIDIA GPU對中國出口受限,DeepSeek過去透過第三方取得H100等GPU的行為已引起美國關注。如果未來管制趨嚴,NVIDIA在中國市場的銷售可能受阻,企業客戶可能被迫尋找本土替代方案,這對NVIDIA的市場佔有率是長期風險。但短期而言,沒有立即的替代品能滿足DeepSeek這樣的尖端AI需求,因此中國市場對NVIDIA的依賴仍然很高。
總的來說,DeepSeek對NVIDIA企業客戶需求和合作關係的影響是可控且可轉機的。一些客戶也許減少了重複造輪子的投入,但他們會將資源轉向部署現有優秀模型,而NVIDIA依然是這個過程中的供應商。NVIDIA也積極調整策略,與包括DeepSeek在內的AI生態系統新星合作,確保自身產品和軟體成為這些創新成果落地的首選平台。因此,NVIDIA的市場版圖和佔有率未有實質削弱,反而因為AI應用範圍的擴大,有機會觸及更多元的客戶群。
財務層面
DeepSeek推出後引發的市場反應,直接體現在NVIDIA的財務指標上。股價方面,2025年1月下旬DeepSeek公佈成果時,投資者憂慮AI產業格局生變,拋售以NVIDIA為首的AI概念股,引發股價劇烈震盪。NVIDIA股價在一月某個交易日暴跌近17%,創下該公司單日最大跌幅,市值當天蒸發約5,930億美元(約6000億)
。這一史無前例的市值損失,反映出市場擔心DeepSeek的低成本AI模型削弱了NVIDIA未來業務的增長預期。投資人意識到,如果AI模型的門檻和成本被大幅壓低,NVIDIA先前享有的“AI熱潮帶來持續賣GPU”故事可能需要重新評估。
然而,從實際收入和業務面看,DeepSeek短期內對NVIDIA財務表現的影響是中性的,甚至是正面的。2024年NVIDIA的數據中心業務收入創下歷史新高,就是因為生成式AI訓練帶動的GPU需求暴增,而DeepSeek恰恰是這波需求的貢獻者之一:據報導DeepSeek相關方在2023-24年間購買了價值約16億美元的NVIDIA GPU用於研發和部署。
這意味著NVIDIA其實從DeepSeek的研發中直接受益(透過硬體銷售)。因此短期財報中,DeepSeek帶來的影響更多體現在市場情緒上,並未傷及NVIDIA已實現的銷售和利潤。
對未來收入增長的影響則有待觀察。如果DeepSeek模式證明AI服務可以用更少的硬體投入實現,那麼某些潛在客戶(例如中小型企業)可能不再購買龐大的GPU集群來訓練模型,而轉向使用現成模型,這可能使NVIDIA未來幾年的銷售增幅低於此前最樂觀的預期。換言之,AI應用如果趨於軟體集約而非硬體集約,NVIDIA的TAM(總可尋址市場)可能會被下調。然而,同時也要看到另一面:低成本AI的普及將激發更多新應用。當AI門檻降低時,許多過去負擔不起大模型訓練的企業和團隊會加入進來,這將拓寬NVIDIA硬體的客戶基礎。例如,一些西方科技公司已開始嘗試複現DeepSeek的高效AI模型理念,以免在新一輪競爭中落後。
這些嘗試本身就需要購買GPU算力來進行研發實驗。因此,廣度的增加有望部分抵消單個項目硬體需求下降帶來的深度減少。正如Annex財富管理的首席經濟學家Brian Jacobsen所指出的,DeepSeek的突破有可能「民主化」AI,帶來新一波應用潮
——對NVIDIA而言,應用增多意味著硬體需求的新增點也變多。
至於市場份額,在AI加速晶片這一領域,NVIDIA目前的份額接近壟斷,DeepSeek並不直接改變這一點
。除非因為DeepSeek導致其他硬體廠商崛起或客戶轉用其他計算解決方案(目前沒有跡象顯示這種情況),否則NVIDIA在該市場的占比依然穩固。需要注意的是,NVIDIA在資本市場的高估值是建立在對未來AI持續高需求的預期上。DeepSeek事件讓部分投資者重新審視這一預期的合理性,因而出現股價修正。然而很多分析師認為市場反應過度:
提到,一些投資專家將那次拋售稱為「矯枉過正」,因為真正為NVIDIA帶來大利潤的仍然是雲端資料中心晶片,而DeepSeek並未動搖這塊基石。事實上,在經歷短暫重挫後,NVIDIA股價隨後又出現反彈,顯示市場在消化資訊後仍認可NVIDIA的長線價值。
整體而言,DeepSeek對NVIDIA既帶來潛在威脅,也創造新的機會。
總體來看,DeepSeek事件提醒了NVIDIA未來的增長不能再完全依賴「大模型=大硬體需求」的舊模式,需要積極擁抱AI技術演進,尋找新的平衡點。NVIDIA已展現出這種靈活性:既快速擁抱DeepSeek模型進行合作,又宣傳自家GPU在新型模型上的優勢,將潛在威脅轉化為自身優勢的證明。未來NVIDIA若能持續扮演AI創新的基石角色,那麼像DeepSeek這樣的突破對它而言更多是商機而非災難——因為無論AI如何發展,NVIDIA都確保自己是提供核心算力的那一方。市場對DeepSeek的劇烈反應折射出對NVIDIA前景的矛盾心理:一方面擔心新技術降低對NVIDIA產品的依賴,另一方面也意識到NVIDIA是這場AI革命背後不可或缺的推手
。只要NVIDIA持續創新並融入這股潮流,其長期價值依然穩固。換言之,DeepSeek帶來的挑戰,也是促使NVIDIA加速前進的動力。