2025/02/17 23:09:59
經濟日報 王薇瑄(聲鮮時采科技營運長、科技媒體專欄作家)
在美國總統川普正式上任的同一天,中國杭州深度求索人工智慧基礎技術研究有限公司推出了一款全新的AI服務軟體「DeepSeek」,採用開源模式(Open Source),聲稱僅以 ChatGPT開發成本的二十分之一,就打造出媲美ChatGPT 的語言模型。
這一技術的突破,讓許多外媒驚艷,甚至將DeepSeek形容為「神祕的東方力量」。
DeepSeek的技術架構基於混合專家模型(Mixture of Experts, MoE),總計擁有6,710億個參數,但每次回答問題時僅會啟動370億個參數,從而優化計算資源,並提升特定任務的處理效率。相比之下,ChatGPT採用GPT架構,每次運行會啟動所有1,750億個參數,提供更全面的運算,但計算成本較高。
在多項評測報告中,全球科技專家深入比較DeepSeek與ChatGPT-4o。結果顯示,DeepSeek在數學問題解決方面表現優異,而ChatGPT-4o 則在一般推理能力上更勝一籌。此外,DeepSeek R1具備更高的成本效益,而ChatGPT-4o則提供更強的多功能性。
DeepSeek的訓練成本較低,AI應用更加普及;然而,與ChatGPT相似,DeepSeek仍面臨隱私與道德的挑戰。
當全球科技界從最初的驚訝中回過神來,隨之而來的疑問是:DeepSeek為何能如此迅速崛起?
根據英國《金融時報》的報導,OpenAI已經發現了一些跡象,顯示DeepSeek可能透過「蒸餾技術(Distillation)」間接獲取其數據。
「蒸餾」是一種AI訓練技術,透過引用更大、更先進的AI模型輸出,訓練較小的模型,使其能在特定任務上以更低的成本達到類似的效果。簡而言之,就是在OpenAI富養的魚池中釣魚,DeepSeek以較廉價的魚餌釣到了錦鯉。
透過蒸餾技術以降低模型訓練成本或許合理,但DeepSeek的投資成本真的只有ChatGPT的二十分之一嗎?《日本經濟新聞》指出,DeepSeek使用的H800晶片價格,相較H100低約一至三成,並非極端便宜。此外,Google DeepMind執行長Demis Hassabis也質疑DeepSeek宣稱的低成本,認為其報告的560萬美元成本,可能僅涵蓋最終訓練階段,這只是總體開發成本的一小部分,因此這一數字可能被「刻意壓低」。
Arm公司執行長Rene Haas甚至認為,DeepSeek的低成本說法可能只是「市場傳言」。OpenAI執行長Sam Altman則表示:「DeepSeek確實是一個非常好的模型,OpenAI會開發出更好的模型,但我們不會像以往那樣維持那麼大的領先優勢。」
依照美國科技公司推出產品的「擠牙膏模式」,ChatGPT可能未發布早已擁有的隱藏功能。果然,就在DeepSeek上市不到一個月後,OpenAI正式宣布推出Deep Research服務,能回答特定領域的專業問題,並整合結果。
這讓我想起了已故的國際武打巨星李小龍。李小龍13歲起便在葉問門下學習詠春,從此與詠春結下不解之緣。李小龍學習廣泛,但對他個人成就影響最深的,仍是詠春,即使他後來自創「截拳道」,其技法仍以詠春為基礎。如果詠春拳與截拳道相類於AI蒸餾技術,那麼這場技術論戰,似乎也能找到對應之處。
沒有葉問,就沒有李小龍,誰是開疆闢土的領航者?又是誰讓武術發揚光大?或許兩派拳術爭論不休,究竟誰才是正宗;但作為武術迷,我們真正關心的是截拳道究竟有沒有用,能否克敵制勝,而非哪一派才是真正的武術。是青出於藍還是人間浮沫,2025年的科技與政治,註定將充滿爭議與變數。
※ 歡迎用「轉貼」或「分享」的方式轉傳文章連結;未經授權,請勿複製轉貼文章內容