先說結論:我認為目前華爾街過度恐慌 (人為製造買點?);矽谷會重新思考成本優化的重要性。本篇文章只探討個人理性認為的產業現狀,不構成任何投資建議,因為資本市場很多時候是不理性的
先簡單說明一下本文背景。近期,一家名為DeepSeek的中國人工智慧(AI)初創公司橫空出世,迅速引起全球關注
該公司近期推出的AI模型DeepSeek-R1,以僅約600萬美元的低成本開發,且在高端晶片的數量受到限制的情況下,性能卻可與美國領先的AI模型媲美。這一突破不僅震撼了矽谷,也在華爾街引發了巨大波動
DeepSeek的崛起導致美國主要科技股市值大幅縮水,單日蒸發近1兆美元。其中,Nvidia股價下跌17%,創下歷史新高,其他科技巨頭如微軟、特斯拉等也受到波及
美國總統川普也表示,DeepSeek的出現應該成為美國企業的「警鐘」,敦促它們加強在AI領域的競爭力。同時,市場分析師也在討論DeepSeek的成功是否會對矽谷產生正面影響,迫使其以更低的成本進行創新
最近,社群媒體與科技網站上充斥著各種關於 DeepSeek 的測評文章,許多評測認為,它的性能與 OpenAI 的GPT-4o 相當,甚至有些認為 o1 模型略勝一籌
如果 DeepSeek 只是在性能上接近 GPT-4o,那麼它可能只是中國 AI 產業的又一個「大外宣」產品。然而,這家原本默默無聞的小公司,卻讓矽谷的科技巨頭震驚,甚至引發美國總統川普特地發表談話。這種反應,顯然不是單純因為 DeepSeek 的技術表現,而是因為:它的成本低得驚人
長期以來,OpenAI、Google DeepMind、Meta、Anthropic 等科技公司都在投入巨額資金建構 AI 訓練基礎設施,因為 AI 競爭的門檻,被普遍認為是「資本+算力」。根據 Meta 內部員工透露: DeepSeek 訓練其模型的成本,甚至比不上 Meta 一位高階主管一年的薪水,而這類主管,Meta 至少有十幾個
更令人震撼的是 DeepSeek 的運行成本僅為主流 AI 模型的 2%,這意味著它不只是「稍微便宜」,而是「砍到只剩零頭」
這樣的結果,並非來自突破性的 AI 研究,而是來自一種業界早已知曉的技術策略:混合專家架構(Mixture of Experts, MoE)
MoE 的概念並不複雜。與傳統大型 AI 模型不同,MoE 並不會在每次運算時啟動所有參數,而是根據輸入的需求,動態選擇部分專家模型參與計算。這就像一間公司,並非所有員工都要參與每個專案,而是根據專長分配適合的專家處理特定問題,從而大幅降低運行成本
但如果 MoE 這麼簡單,為何 DeepSeek 是第一個真正將這一策略發揮到極致的公司?這才是讓矽谷技術圈與華爾街金融圈真正感到不安的地方,如果 AI 訓練成本能夠壓低到這種程度,那麼過去許多對 AI 市場的估值,是否還站得住腳呢?
如果 DeepSeek 的低成本模式屬實,那麼不僅科技圈,連資本市場對 AI 的估值方式都將被顛覆。然而,這是否意味著我們看到了完整的真相?還是有些關鍵資訊被刻意忽略?
有分析指出,DeepSeek 可能低報了實際的訓練成本,其中一個關鍵疑點在於 Nvidia H100 晶片的使用量。有觀點認為,DeepSeek 可能擁有至少 50,000 片 H100 晶片,但未對外公開這個數據,藉此營造出「低成本訓練」的形象
此外,一些測試發現,DeepSeek 在處理長文本時可能存在算力不足的情況,這讓人懷疑他們是否在訓練階段進行了某些取捨,以降低計算資源的需求。然而,這樣的做法可能影響模型在長文本推理上的一致性與準確性
另一個值得關注的點是,DeepSeek 可能在訓練過程中採取了一些「捷徑」,以在有限的算力下訓練出高品質模型。其中 「知識蒸餾」(Knowledge Distillation) 就是一種可能的策略。這是一種讓較小的模型學習大型模型知識的方法,透過這種方式,他們可以大幅降低成本,同時保留大部分的模型效能
但無論真相如何,我們可以確定的是 DeepSeek 確實在降低成本上展現出了極為明顯的突破。而這種突破,勢必將為整個產業帶來巨大的變革,甚至可能重塑市場的競爭格局
雖然市場上對於 DeepSeek 的成本統計仍有爭議,但毋庸置疑的是 DeepSeek 的出現顯著降低訓練和使用 AI 模型的成本。這項技術的突破使 AI 不再是僅限資金雄厚的大型企業專屬的高端工具,更多中小型企業甚至個人開發者也因此能夠負擔起使用成本
一個可以對應的例子是智慧手機的普及
在2000年代初,智慧手機因製造成本高昂,主要針對高端市場,售價也居高不下。然而,隨著硬體技術的不斷進步與生產規模的擴大,製造成本逐步降低,使智慧手機從一件昂貴的奢侈品,逐漸變為普通消費者也能輕鬆負擔的日常用品。雖然單台智慧手機的利潤因此變薄,但全球需求卻爆炸性增長
因此,整個產業的總體收益不僅未受影響,甚至實現了大幅增長。這一點在2010年代的中國市場尤為明顯,例如小米等品牌憑藉「低價高質」的策略快速擴大市場,最終依靠龐大的銷量實現了驚人的利潤
DeepSeek 帶來的市場效應與此有異曲同工之妙
隨著 AI 應用的門檻降低,各行各業都能利用 AI 提升產品和服務的價值。舉例來說,過去只有大型電商平台才能負擔高成本的 AI 訓練,用於開發精準的個性化推薦系統,幫助用戶在眾多商品中快速找到心儀的產品
然而,隨著 AI 訓練成本下降,這樣的技術不再是巨頭的專屬
未來,即使是小型網路商店也能使用 AI 技術打造專屬的推薦系統,例如針對顧客的購物紀錄與偏好提供貼心建議,甚至可以讓附近的咖啡店在外送平台上,為不同的顧客推薦他們最可能喜歡的飲品組合。這將使小型業者與大企業站在同一起跑線上,進一步促進市場的多樣化與活力
這樣的市場變化也帶來了一個不可忽視的現象:算力與電力需求的劇增
例如在數位廣告產業,隨著 AI 生成技術的成本下降,越來越多的公司將生成內容應用於廣告製作,從個性化影片到動態圖片,都能迅速生成。儘管 DeepSeek 提升了算力與電力的使用效率,但因需求激增,整體的算力與電力消耗不降反增。這種情況不僅發生在數位廣告領域,還能在醫療影像分析、自動化客服等領域觀察到。這些技術的快速普及,固然提升了效率與生產力,但同時也加劇了對基礎設施的壓力
接下來,我們來探討一些較為負面的市場資訊。專為 Transformer 模型設計的專用晶片公司,可能會在這波技術浪潮中成為最大的受害者。以 Etched 公司為例,他們推出了名為 Sohu 的專用晶片,聲稱在大型語言模型的推理性能上,比 NVIDIA 的 H100 GPU 快 20 倍
然而,隨著 MoE 架構的興起,市場可能會重新評估對專用晶片的需求
MoE 模型透過結合多個專家網路,能夠在不同任務間靈活調度資源,提升效率。 這種架構的彈性,使得通用GPU,如 NVIDIA 的 H100,仍具備競爭優勢,因為它們能夠適應多樣化的 AI 工作負載
因此,儘管專用晶片在特定應用上展現出色性能,但在市場趨勢的影響下,通用 GPU 可能仍是未來的主流選擇。專注於單一模型的專用晶片公司,可能需要重新思考其策略,以應對這種變化
本篇文章提到 DeepSeek 技術如何大幅降低 AI 訓練與使用成本,並探討這項技術變革可能帶來的市場影響。綜合這些觀點,我們可以預測幾個未來產業的重要趨勢
首先,算力需求將呈現出一種有趣的矛盾現象。一方面,隨著 AI 技術成本的下降,其應用將更加普及,推動對算力需求的持續增長;另一方面,技術進步使算力的使用效率顯著提高,也就是說,同樣的運算需求能以更少的資源完成
因此,隨著 AI 應用範圍擴大,整體算力需求不僅不會減少,反而會大幅增加
其次,能源產業也將面臨挑戰與機遇的並存。雖然 DeepSeek 等技術能降低每次運算的能耗,但由於總運算量的急速上升,能源消耗的總需求仍將顯著增長。這種趨勢為高效能電力基礎設施的發展提供新動力,同時也將催生更多能源相關創新的投資機會,對行業來說是一個重要的增長點
以上兩點對算力供應鏈的企業來說無疑是重大利好,但它們同時也對基礎設施的擴展與優化提出了更高的要求
再者,散熱技術可能成為未來十年內極為關鍵的產業之一。隨著 AI 應用的廣泛普及,無論是資料中心還是邊緣運算裝置,高效散熱解決方案的需求將同步上升。散熱技術的創新不僅是解決硬體瓶頸的關鍵,還將成為高度競爭的市場領域,吸引更多企業投入資源
然而,這一趨勢對某些專用晶片設計公司來說卻未必是好消息。隨著 MoE 架構逐漸成為 AI 訓練的主流,通用GPU 晶片(如 NVIDIA 的 H100)憑藉其多樣性與靈活性,將繼續主導市場。相比之下,那些專為單一模型設計的晶片公司,可能因需求減少而面臨嚴峻挑戰
回顧華爾街對這波技術變革的反應,不難發現恐慌情緒的背後更多是投機者的不安,以及部分專家煽動下的市場波動。這些擔憂往往聚焦於短期影響,而忽略了長期趨勢中的結構性機會
無論是算力、能源還是散熱技術,這些產業都將伴隨 AI 的普及迎來新一輪增長浪潮。能否把握這些關鍵趨勢,將成為未來企業與市場成功與否的分水嶺
*再次強調:本人是8zz等級的股海冥燈,因此本文不構成任何投資建議!!
長久以來,中國產業以「應用為王」的特性著稱,展現出在內捲與成本優化方面的無與倫比的能力
然而,這種強調效率與成本競爭的模式,在某種程度上也限制了中國在產業創新上的發展潛力。從科技研發到基礎技術的突破,中國往往更擅長將現有技術落地並快速推廣,而非在原始創新上領先
相較之下,美國在 AI 創新領域的領先地位依然無可挑戰
不論是技術框架的提出,還是基礎模型的研發,美國始終站在全球科技前沿。這樣的優勢不僅來自龐大的資本支持,還得益於自由的學術環境與多樣化的創業生態系統。未來,全球最重要的 AI 創新依然極有可能由美國主導
然而,DeepSeek 的突破卻像是一記當頭棒喝,提醒著美國的科技領域:僅靠高成本的創新是否足以支撐整個產業的長遠發展?
DeepSeek 的成功,不僅僅是技術上的勝利,更是一個關於「如何讓技術落地」的典範。它迫使投資者重新審視:在追求技術前沿的同時,我們是否忽略了讓創新技術以合理成本與價格進入市場的重要性?
產業創新的目的,最終還是要服務於市場與大眾。DeepSeek 提醒我們,科技進步不僅需要突破性的創新,也需要能支撐產業健康循環的經濟模式。這一點,或許將在未來的全球競爭中變得越來越關鍵