就在農曆除夕,中國AI新創公司—DeepSeek,推出全新AI訓練模組,號稱表現不比Open AI的『ChatGPT』差,並且只使用輝達晶片成本不到600萬美金,相比之下,Open AI的訓練成本多達20倍以上。
消息一出,美國科技股暴跌,不論是晶片股輝達,設備股ASML,記憶體美光,都受到嚴重的衝擊。不過,隨著一系列的證實,美國科技股又重新回到成長階段。
那麼,DeepSeek到底有何來頭?未來會威脅到科技巨頭們嗎?對於美國的AI會帶來什麼衝擊?輝達還能夠持續高速成長嗎?
首先,我想從幾個角度來跟大家分享:
1.DeepSeek到底是誰?
DeepSeek的創辦人—梁文鋒,擁有中國浙江大學通信工程的碩士,主修機器視覺相關,原本從事的是科技業的工作,在疫情期間,跟朋友合資開創了量化交易。透過訓練模組跟大數據自動下單,獲取利潤,讓梁文鋒從一般的工程師,成為了金融巨富。
透過金融海嘯累積的財富,梁文鋒在2015年創立了『幻方量化』這家AI公司,開始專注於AI相關領域,並在2023年推出深度求索—『DeepSeek』,讓中國市場震驚,原來除了百度,阿里等一線的中國科技巨頭外,居然還有一家中國新創公司,正在引領著中國的AI前進。
從梁文鋒的訪談中不難發現,有別於大型的科技巨頭,DeepSeek更是著重『新創』公司的彈性跟規模,DeepSeek採取『彈性』,『組織小』,『想辦法開發出模型而非營利導向』導致了DeepSeek提供了開源模型給一般大眾,讓想要開發或使用AI的一般人都可以使用,不僅可以打開AI應用的大門,又可以降低成本,的確在『性價比』上,貼近市場的需求,立馬一砲而紅。
2.DeepSeek 謠言滿天飛?
DeepSeek宣稱自己的晶片訓練成本只有560萬美元,相對於Open AI的數億美金來說,節省了不少成本,也讓想要切入AI的公司,不見得需要花上大筆資金,也可以做出簡單的應用,未來搶攻更多低價的市場。
不過,許多美國科技巨頭認為,DeepSeek並不是用『簡配版』的輝達晶片,而是繞了一個彎,想辦法買到輝達的『H100』。據了解,DeepSeek可能擁有5萬張H100的晶片,如果是真的,這樣訓練的成本可能高達上百億台幣,而非目前揭露的2億台幣的訓練成本。
3.Open AI被盜用?
而且,就在DeepSeek 公布訓練模組後一天,Open AI表示,DeepSeek是根據Open AI的模型擷取之後訓練出來的成果,本質上還是Open AI的技術,而非DeepSeek自身開發。
我認為這個可能性很高。由於中國AI發展一直受到限制,也落後美國一大截,不太可能短時間彎道超車,但是如果透過既有Open AI的模型改良,的確可以大幅度改善訓練時間,不得不佩服DeepSeek『找縫鑽』的能力。
不過就像比亞迪之餘特斯拉,華為之餘蘋果,DeepSeek之餘Open AI,都是在既有的框架上做出優化的改變,的確是中國一直以來的強項。
4.AI 未來會怎麼改變?
我認為,DeepSeek的橫空出世,對於AI的發展反而是『助燃』的效果。因為這幾年AI的發展,著重於模型的訓練跟AI晶片升級的『軍備競賽』。目前由於設備成本昂貴,只有科技巨頭有辦法投入大量資金,對於一般中小企業要切入AI仍然需要很長的時間。隨著DeepSeek這種有『性價比』的『簡配』產品出現,我覺得對於AI的普及化反而會有很大的幫助。
至於對美國晶片股來說,我認為不會是壞事。隨著AI的普及化,未來對於記憶體,AI GPU甚至是半導體製造的台積電,設備商的ASML,都會因為需要的晶片變多,有更多的產出跟獲利。
對於高端的應用是否受到影響?我認為不會,對於科技巨頭來說,如果需要更複雜的訓練,更快速的運算,仍然需要輝達的高階產品,至於中小企業,本來就不會選擇輝達的高階產品,反而在中低階產品會有更多的機會,對於AMD跟輝達都會有機會搶攻市場。
我認為輝達在既有市場上有很多經驗,稍做修改就能推出『低階』版的產品,還是最具優勢。至於美國會不會禁止DeepSeek,要等更多的使用反饋才會決定,如果DeepSeek技術已超越Open AI,那麼禁令在未來肯定會發生,如果沒有,我認為美國會當作單一事件,持續觀察。