還記得上次和大家分享人工智慧研究的三大核心組成部分:取樣(Sampling)、模型(Modeling)和演算法(Algorithm),這些構成了人工智慧系統的基礎。
近日,DeepSeek R1 的表現成為人工智慧科技領域的焦點話題。根據其官方發佈的論文,這款模型在多項測試中表現優異,推理能力甚至略勝於 OpenAI 的 o1 模型,而且成本更為低廉。

DeepSeek R1 的核心優勢來自於其對強化學習 (Reinforcement Learning) 的演算法改進,論文中還大方地分享了過程中的失敗嘗試,例如:獎勵模型的局限性、如何避免獎勵機制重新訓練帶來的額外資源浪費,以及利用蒙地卡羅搜尋增強測試時的計算可擴展性,這些都是很有幫助的學術貢獻。
這次我不想細談論文的技術細節,而是想聚焦於這款模型目前在國際上的影響力。就在過去兩天於 Davos 舉行的世界經濟論壇中,除了關於世界經濟的議題之外,微軟執行長和 Scale AI 執行長都提到了來自中國的 DeepSeek 公司。這款 DeepSeek R1 模型在美國的社群討論熱度幾乎壓倒了 OpenAI Operator 發佈的聲量。
而美國知名商業頻道 CNBC 更製作了一段 40 分鐘的專題報導,深入剖析這款新 AI 模型,如何威脅美國主導地位帶來的挑戰。DeepSeek 的成功是否能撼動資本雄厚的美國科技巨頭?目前一些科技業界領袖也意識到這件事:
微軟執行長 Satya Nadella:
「看到 DeepSeek 的新模型,我感到非常震撼!無論是效率還是開源模式,它都令人印象深刻。」
Scale AI 執行長 Alexandr Wang:
「DeepSeek 是中國領先的 AI 實驗室,他們的模型表現相當好,甚至媲美美國的頂尖模型。」
前 Google 執行長 Eric Schmidt:
「看起來 DeepSeek 正以驚人的速度迎頭趕上。」
Perplexity 執行長 Aravind Srinivas:
「如今,許多企業都在複製彼此的成果。你可以說 Google 首創了 Transformer 模型,而 OpenAI 只是複製了它。Google 創建了第一個大型語言模型,卻沒有推向生產;而 OpenAI 則將其落地實現,DeepSeek也是如此」
然而,隨著巨額資金不斷投入於大型語言模型,這也帶來了一個問題:如果每個企業都在複製彼此,是否還有足夠的創新空間?投入於這些獨立 LLM 的巨額支出是否仍然是一個好的投資選擇?原本以為還要長一點的時間,沒想到DeepSeek V3到R1相隔不到一個月發表,或許不久之後,資本市場關注資本支出,可能不會是推動股價的動力而是阻力。
另外我認為,這次中國採用低成本的策略是一個值得學習的方向。
關於科技進步與社會影響之間的平衡。中國選擇以低成本策略推進 AI 發展,可能最終造福的層面會比較廣泛且普及,而不是純粹追求算力的高門檻競爭,不過中國打造的模型必需體現中國社會主義的核心價值,DeepSeek的論文自己也有說。
常常有人提到 AI 會不會取代人類,但我認為,人類的貪婪可能更早毀掉社會的不平等。如果按照目前資本主導的軍備競賽繼續發展下去,大部分資源最終可能集中在少數資本手中,使人工智慧淪為昂貴的工具,而難以真正實現人工智慧的民主化。
算力與能源的高昂成本正是這場競賽中的關鍵問題。如果缺乏有效的資源回收機制與可持續發展策略,AI 技術的推進反而可能進一步這些不平等。
美國與中國現在正處於一場新的冷戰競爭中。從歷史中我們可以看到,上世紀美國與蘇聯的冷戰太空競賽,不僅推動了技術的進步,還促成了衛星通信GPS 的普及,以及更精準的氣象預測等科技應用的誕生。
在上次冷戰中,美國為了拉攏中國對抗蘇聯,台灣最後退出聯合國,如今,中國成為競爭對手,而現在台灣似乎成為被拉攏的核心對象,要怎麼選邊站應該很明顯,不過那又是另一個話題了。
2025年1月25日 https://www.facebook.com/share/p/161JrGhei8/