更新於 2025/01/29閱讀時間約 3 分鐘

夯番薯週記|DeepSeek

一、《DeepSeek》 到底在紅什麼?為什麼讓Ai類美股大跌?

DeepSeek是什麼?

  在這一個月內中國Ai新創公司發表 DeepSeek-V3 和 DeepSeek-R1 兩款大語言模型,其中R1模型僅花費600萬美元,使用2048組H800晶片,並在兩個月內完成訓練;相較於美國Ai巨頭Meta、Open Ai,動輒上億美金的模型訓練費,以及使用H100的更高階晶片,打破了傳統認知「高成本高效能」,並且在成果上顯示,DeepSeek-R1在許多方面都與當今最強的模型o1並列。

  最令人驚豔的是,DeepSeek團隊將R1的模型程式碼開源,並公布訓練的參數與細節,讓所有人可以進行大模型蒸餾,使用R1的開發成果,這種開源的行為可以促進更多的研究者與企業投入,使模型發展更為迅速。




為什麼美股會大跌?

  綜上兩個特點,只需要極低的成本即可獲得相同效果的Ai模型,和開源程式碼,讓這項商業機密不再被壟斷,嚴重威脅到現有的科技公司的利益,並也使人猜想未來是否需要投入如此多的資金在Ai基礎設施,導致NVIDIA等多個Ai類股股價大跌。




NVDA的股票真的不值錢了嗎?

  不過Ai基礎設施真的不值錢了嗎?我覺得倒也未必,從DeepSeek-R1論文中指出,其訓練模型費用,只包含「後訓練」的費用,並沒有將DeepSeek-V3-Base的預訓練費用計算入內,所以真實的成本未必如想像中的便宜。

  即使未來Ai巨頭或許不再需要那麼多晶片,但若未來Ai普及到每個人的所有裝置,都搭載Ai的功能,NVDA的晶片或許還是十分值得期待的,就如同當年沒有人知道個人電腦會普及,微軟看到了其他人沒看到的風潮,成為如今的巨頭。

  未來勢必是Ai的時代,我們是否能成為新的浪口上的船就看個人抉擇了。


小札記

  這波DeepSeek-V3模型的風潮,讓人十分興奮呀,馬上手刀註冊DeepSeek用用看,希望官方趕快發驗證碼給我,拜託拜託,最後祝大家新春快樂,新的一年蛇麼都如意。

2025.1.28 除夕 寫於新竹


以下是我的部落格歡迎造訪


分享至
成為作者繼續創作的動力吧!
從 Google News 追蹤更多 vocus 的最新精選內容從 Google News 追蹤更多 vocus 的最新精選內容

狐思亂想的沙龍 的其他內容

你可能也想看

發表回應

成為會員 後即可發表留言
© 2025 vocus All rights reserved.