夯番薯週記|DeepSeek

更新 發佈閱讀 2 分鐘

一、《DeepSeek》 到底在紅什麼?為什麼讓Ai類美股大跌?

DeepSeek是什麼?

  在這一個月內中國Ai新創公司發表 DeepSeek-V3 和 DeepSeek-R1 兩款大語言模型,其中R1模型僅花費600萬美元,使用2048組H800晶片,並在兩個月內完成訓練;相較於美國Ai巨頭Meta、Open Ai,動輒上億美金的模型訓練費,以及使用H100的更高階晶片,打破了傳統認知「高成本高效能」,並且在成果上顯示,DeepSeek-R1在許多方面都與當今最強的模型o1並列。

  最令人驚豔的是,DeepSeek團隊將R1的模型程式碼開源,並公布訓練的參數與細節,讓所有人可以進行大模型蒸餾,使用R1的開發成果,這種開源的行為可以促進更多的研究者與企業投入,使模型發展更為迅速。



raw-image


為什麼美股會大跌?

  綜上兩個特點,只需要極低的成本即可獲得相同效果的Ai模型,和開源程式碼,讓這項商業機密不再被壟斷,嚴重威脅到現有的科技公司的利益,並也使人猜想未來是否需要投入如此多的資金在Ai基礎設施,導致NVIDIA等多個Ai類股股價大跌。



raw-image


NVDA的股票真的不值錢了嗎?

  不過Ai基礎設施真的不值錢了嗎?我覺得倒也未必,從DeepSeek-R1論文中指出,其訓練模型費用,只包含「後訓練」的費用,並沒有將DeepSeek-V3-Base的預訓練費用計算入內,所以真實的成本未必如想像中的便宜。

  即使未來Ai巨頭或許不再需要那麼多晶片,但若未來Ai普及到每個人的所有裝置,都搭載Ai的功能,NVDA的晶片或許還是十分值得期待的,就如同當年沒有人知道個人電腦會普及,微軟看到了其他人沒看到的風潮,成為如今的巨頭。

  未來勢必是Ai的時代,我們是否能成為新的浪口上的船就看個人抉擇了。


小札記

  這波DeepSeek-V3模型的風潮,讓人十分興奮呀,馬上手刀註冊DeepSeek用用看,希望官方趕快發驗證碼給我,拜託拜託,最後祝大家新春快樂,新的一年蛇麼都如意。

2025.1.28 除夕 寫於新竹


以下是我的部落格歡迎造訪


留言
avatar-img
留言分享你的想法!
avatar-img
狐思亂想的沙龍
17會員
46內容數
我是位文字魔法師,喜歡透過寫作施展我的魔法,會分享關於影評、書評和對時事的想法。在茫茫人海中,若你願意駐足片刻,即是有緣,願我的文字能為你帶來些許啟發或療癒,這是我開始寫部落格的初衷,珍惜每一位因為這個平台和我相遇的人,歡迎大家和我分享交流。
狐思亂想的沙龍的其他內容
2025/02/28
《二二八事件》 歷史的傷痕 民主的進程   這期的夯蕃薯事件要將時間倒回到78年前的今天,對當時生活在台灣的人民來說這是不安寧的一天,先看一下二二八的時間軸看看當時究竟發生了什麼!
Thumbnail
2025/02/28
《二二八事件》 歷史的傷痕 民主的進程   這期的夯蕃薯事件要將時間倒回到78年前的今天,對當時生活在台灣的人民來說這是不安寧的一天,先看一下二二八的時間軸看看當時究竟發生了什麼!
Thumbnail
2025/01/08
《麥當勞事件懶人包》這次麥當勞主管利用排班職權對16、17歲少女性侵的事件,大致的過程可以看到下面的時間軸,從少女受到侵害到向警方、麥當勞方尋求協助,最後遲遲等不到道歉而選擇輕生。在麥當勞事件後,建中學生在網上po出揪團吃麥當勞的照片,引發第二波炎上。
Thumbnail
2025/01/08
《麥當勞事件懶人包》這次麥當勞主管利用排班職權對16、17歲少女性侵的事件,大致的過程可以看到下面的時間軸,從少女受到侵害到向警方、麥當勞方尋求協助,最後遲遲等不到道歉而選擇輕生。在麥當勞事件後,建中學生在網上po出揪團吃麥當勞的照片,引發第二波炎上。
Thumbnail
2024/12/21
一、《憲訴法修法》為什麼會癱瘓憲政體制?這是民主問題還是政治問題?   為什麼修改《憲訴法》會影響民主憲政呢?違憲宣告是對憲政的伸張?還是政治的工具呢?   先快速了解憲訴法修改大家在擔心什麼,主要有2個部分 1. 宣告違憲所需大法官人數增加為至少10人   以往若發生疑似違憲的事件或法案,
Thumbnail
2024/12/21
一、《憲訴法修法》為什麼會癱瘓憲政體制?這是民主問題還是政治問題?   為什麼修改《憲訴法》會影響民主憲政呢?違憲宣告是對憲政的伸張?還是政治的工具呢?   先快速了解憲訴法修改大家在擔心什麼,主要有2個部分 1. 宣告違憲所需大法官人數增加為至少10人   以往若發生疑似違憲的事件或法案,
Thumbnail
看更多
你可能也想看
Thumbnail
近期,DeepSeek V3的出現引爆了全球科技業和矽谷的恐慌,直接嚇壞 Meta! 除了各項數據的表現不俗,最關鍵的,是這個來自中國血統,可與 ChatGPT 抗衡的 DeepSeek, 其最新AI模組 V3 只花了557萬美元訓練,甚至比美國科技業某些高管的年薪還低...
Thumbnail
近期,DeepSeek V3的出現引爆了全球科技業和矽谷的恐慌,直接嚇壞 Meta! 除了各項數據的表現不俗,最關鍵的,是這個來自中國血統,可與 ChatGPT 抗衡的 DeepSeek, 其最新AI模組 V3 只花了557萬美元訓練,甚至比美國科技業某些高管的年薪還低...
Thumbnail
本篇文章深入探討了大型企業導入AI技術時,代理商和IT顧問公司的重要角色,並提供了對股票投資的分析觀察。文章中包含了對Accenture(艾森哲)公司和AMD等公司的投資理由,以及市場預期的未來預測。
Thumbnail
本篇文章深入探討了大型企業導入AI技術時,代理商和IT顧問公司的重要角色,並提供了對股票投資的分析觀察。文章中包含了對Accenture(艾森哲)公司和AMD等公司的投資理由,以及市場預期的未來預測。
Thumbnail
除現有已知的 AI 硬體建構廠商外,本篇並列出作者對於下一波 AI 應用興起時之潛力企業觀察清單,包含網路服務、網路安全、行業運用方案解決業者、與 AI 軟體開發商等。
Thumbnail
除現有已知的 AI 硬體建構廠商外,本篇並列出作者對於下一波 AI 應用興起時之潛力企業觀察清單,包含網路服務、網路安全、行業運用方案解決業者、與 AI 軟體開發商等。
Thumbnail
致力於研發 AI 翻譯的德國新創 DeepL,是 Google 翻譯強勁的競爭對手,2023 年 1 月至今估值已經翻倍成長,上探 20 億美元(約新台幣 643.1 億元)。
Thumbnail
致力於研發 AI 翻譯的德國新創 DeepL,是 Google 翻譯強勁的競爭對手,2023 年 1 月至今估值已經翻倍成長,上探 20 億美元(約新台幣 643.1 億元)。
Thumbnail
小語言模型SLM急起直追 這次財報上,我關注到了這個陌生的詞,SLM。查了一下,原來是Small Language Model。 我們還持續創新,為客戶提供最好的前沿模型和開源模型、大型語言模型和小型語言模型的選擇。
Thumbnail
小語言模型SLM急起直追 這次財報上,我關注到了這個陌生的詞,SLM。查了一下,原來是Small Language Model。 我們還持續創新,為客戶提供最好的前沿模型和開源模型、大型語言模型和小型語言模型的選擇。
Thumbnail
筆記-股癌-2024.03.27 *GB 200全開圖了,目前拆到很細的東西, AI股越來越難做了,因為有很多的訊息領先者, 例如,有聽到美國安費諾(Amphenol)在AI伺服器拿到很多訂單(swtich、socket),但不久之後中國的投資論壇網站就有消息流出。 *散熱的VRT,剛開始聽
Thumbnail
筆記-股癌-2024.03.27 *GB 200全開圖了,目前拆到很細的東西, AI股越來越難做了,因為有很多的訊息領先者, 例如,有聽到美國安費諾(Amphenol)在AI伺服器拿到很多訂單(swtich、socket),但不久之後中國的投資論壇網站就有消息流出。 *散熱的VRT,剛開始聽
Thumbnail
本篇文章介紹了智能投資、科技與金融的結合,以及相關的投資策略與市場趨勢。內容涉及科技產品的市場需求與供應、個人生活與體悟、產業分析與市場觀察、臺股市場表現與個人心態、AI技術發展等各方面。文章中提到了一些公司和產品的名稱,如OpenAI的Sora、Supermicro等。
Thumbnail
本篇文章介紹了智能投資、科技與金融的結合,以及相關的投資策略與市場趨勢。內容涉及科技產品的市場需求與供應、個人生活與體悟、產業分析與市場觀察、臺股市場表現與個人心態、AI技術發展等各方面。文章中提到了一些公司和產品的名稱,如OpenAI的Sora、Supermicro等。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News