Deepseek 模型的真實開發成本可能遠不止6百萬刀

更新於 發佈於 閱讀時間約 5 分鐘
raw-image


關於deepseek仍然存在有一些疑問,不疊甲。

我屁股長在我自己身上,不長在美國人那裡。

村裡沒發金條,也沒有CIA組織發我50W,因為DOGE在砍美國預算。

所以我現在就是爸不疼娘不愛,講點不討人喜歡大實話的路人。

更詳細的移步油管視頻,有我的詳細解析。

1)deepseek V3model 6M 刀只計算了pre training 環節,難道前期post training 或是hardware 以及人力成本都不計算成本?

2)ds模型招募來看(boss直聘等平台),隨便一個演算法工程師都是16薪每月接近100k 水平,這接近200W年薪的薪資還是初級工程師,看上去真不差錢。

3)幻方頂峰的時候管理規模1000億左右,2024年底還有36只產品屬於虧損狀態。幻方成立於2015年,現在規模有所縮減,即便在頂峰時期,管理費假設收滿2%(業內都知道不可能收滿,渠道要分),管理費revenue在20億rmb左右,我就算1000個億一分錢沒虧,賺20%,20%highwater, 就是1000 億美元成本,軟體或是策略開發/伺服器硬體成本。 2015成立至今算9年,我們假設這個樂觀獲利模式持續5年,那就是300E的純利潤(不扣除任何成本),這個數字已經超級無限樂觀。

4)300E能夠支撐佛心不獲利的開源「純公益」手打小團隊?一個「開源」純公益小團隊不差錢到演算法工程師junior年薪接近200個W?實習生都有1k每天薪資直逼一線城市中階主管水準?純手打樂趣公益團隊就算幻方這300個E不分錢不發薪資不付辦公室房租沒有任何通路代銷費用純300個億我就算是CEO個人資產,夠這個DS模型這麼燒錢能夠燒多久?

5)從算力回推,DS模型成本光硬體最少最少是10個億美金,這你注不了水,因為NVDA每張卡都是能算出來的,各家成本都差不多,能夠降的是per token成本,不是你硬體成本。所以還是問,這300億算幻方營運9年的總純利潤拿出來燒這個模型,還搞開源純公益,其他地方都不用花錢了嗎?

6)AI產業每個演算法工程師都貴的要死,人力成本軟體開發成本一點不少。從招募網站也可以回推(請搜尋幻方謝謝)DS的開發團隊也不是什麼小作坊,最少150人上下的配置,這些都不用計算在訓練模型的成本嗎?所謂的「純手工公益小團隊隨便囤了些老舊gpu卡,一不小心宅家裡就開發了吊打西方眾多巨頭的AI模型「這種屌神話還能相信那真的沒啥金融素養。

7)你本業量化交易策略產品都在虧損你還沒業績壓力?你客戶不說?不覺得你的副業搞得有點太大了?你副業還在無止盡燒錢,管理規模都在縮水了,反正你本業沒做好,你投資者,股東都無所謂對吧?

8)懂資管這個行業的都懂,做基金這件事,本質上是管理其他人的錢。你幾百億跟我屌絲基金經理一毛錢關係沒有,管理費和抽成才有關係。所以本質上做私募,也就跟著富人一起喝肉湯,做到1000個億規模,創始人個人拿個幾億回家很夠用了也不錯。但你要跟矽谷的全球資本(meta/google/microsoft等)以及一眾vc拼AI這條賽道,你沒有一點資本真的很困難。或許你創辦人本身有情懷,但砸那麼大的本錢去搞一個和自家本業現階段沒有太多聯繫,無法增加業績收入,而且還搞開源公益的AI模型實際上我認為是不符合邏輯和創始人錢包對應的深度的。

9)最後強調,DS模型在技術上有突破是好事,這也意味著突破了西方在AI領域的技術壟斷被DS模型所攻破。無疑DS模型是有巨大意義的,但我個人認為,如果在V3發布這個成本的時候,不要誇海口說自己只花了600萬美金做開發,起碼強調是pretraining一個環節的,那麼後續不會引發這麼多質疑。再者,R1對標的是去年5月的chatGPT, 現在來看DS模型也沒有到頂尖,但的確是好模型。

10)西方沒人看不起你DS模型的表現與意義,別妄自菲薄也別把DS模型神話了,重要是平常心。再這麼搞下去完全可以理解為是捧殺,別有用心對吧。

最後的最後,

就是因為西方有意圍堵,好不容易做成績出來了,是不是暗渡陳倉一下,不要急功冒進,這屬於是逼迫各路AI起床不躺平的節奏,後續大量資本將砸在AI這條賽道,要知道,現在AI模型拼的真的不是解題,而是最後誰可以把per token成本壓到最低(需要壟斷資本和翹神),

這也意味著,即便你領先一個版本和模型,各家也會迅速追上,因為LLM模型的訓練成本的確下降了不少,現在AI本來就在成本下降的趨勢裡。就是因為老有那種動不動趕英超美的傻X, 我們永遠心智仍然處於解放前。

留言
avatar-img
留言分享你的想法!
avatar-img
美股和總經交易
7會員
66內容數
美股+全球總經+聯準會觀察
美股和總經交易的其他內容
2025/02/24
華爾街債券之王"預見債務重組可能帶來全球性影響
Thumbnail
2025/02/24
華爾街債券之王"預見債務重組可能帶來全球性影響
Thumbnail
2025/02/13
當下的美國全球戰略包含了幾個最致命的問題,隨著川普的關鍵政策逐步落地,明朗化,金融市場的不確定性逐漸消減,但國際地緣政治的不確定性卻在成倍擴大: 1)無法處理關稅,美元,利率和通膨之間的本質矛盾。以關稅作為收入,對比於收稅的收入,那隻不過是杯水車薪。寄望於透過統一性的關稅來獲得足夠的財政收入
Thumbnail
2025/02/13
當下的美國全球戰略包含了幾個最致命的問題,隨著川普的關鍵政策逐步落地,明朗化,金融市場的不確定性逐漸消減,但國際地緣政治的不確定性卻在成倍擴大: 1)無法處理關稅,美元,利率和通膨之間的本質矛盾。以關稅作為收入,對比於收稅的收入,那隻不過是杯水車薪。寄望於透過統一性的關稅來獲得足夠的財政收入
Thumbnail
2025/02/07
人工智慧深度求索的真實開發成本 原文来自于: https://semianalysis.com/2025/01/31/deepseek-debates/
Thumbnail
2025/02/07
人工智慧深度求索的真實開發成本 原文来自于: https://semianalysis.com/2025/01/31/deepseek-debates/
Thumbnail
看更多
你可能也想看
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
本文探討大型語言模型的發展趨勢,並以DeepSeek-V3為例,分析其在模型架構、訓練方法和效率成本上的改進。作者指出,大型語言模型的競爭焦點已轉向實際應用和數據的運用,而非模型間微小的性能差異。
Thumbnail
本文探討大型語言模型的發展趨勢,並以DeepSeek-V3為例,分析其在模型架構、訓練方法和效率成本上的改進。作者指出,大型語言模型的競爭焦點已轉向實際應用和數據的運用,而非模型間微小的性能差異。
Thumbnail
科技議題 隨著 DeepSeek 和 OpenAI 的推理模型(Reasoning AI)崛起,市場對人工智慧(AI)投資的重點正從基礎建設(如資料中心與晶片)轉向推理運算(Inference),並推動 AI 整體支出增長。根據 Bloomberg Intelligence 的最新預測,亞馬遜、M
Thumbnail
科技議題 隨著 DeepSeek 和 OpenAI 的推理模型(Reasoning AI)崛起,市場對人工智慧(AI)投資的重點正從基礎建設(如資料中心與晶片)轉向推理運算(Inference),並推動 AI 整體支出增長。根據 Bloomberg Intelligence 的最新預測,亞馬遜、M
Thumbnail
事情真的是這樣嗎? 最近,大家在看電視的時候,常聽到人們談論一款叫做Deepseek的AI軟體。許多人都認為這個軟體非常好用,而且號稱只用500多萬美金的投資,就能打造出媲美那些花費數十萬甚至數十億美金的AI系統。但事情真的是這樣嗎? 吹捧為非常了不起 對於像我這樣已經寫了很多年的開發者來說,
Thumbnail
事情真的是這樣嗎? 最近,大家在看電視的時候,常聽到人們談論一款叫做Deepseek的AI軟體。許多人都認為這個軟體非常好用,而且號稱只用500多萬美金的投資,就能打造出媲美那些花費數十萬甚至數十億美金的AI系統。但事情真的是這樣嗎? 吹捧為非常了不起 對於像我這樣已經寫了很多年的開發者來說,
Thumbnail
DeepSeek以557.6萬美元訓練成本,顛覆AI行業規則!從「架構瘦身」到「數據煉金」,再到「硬體巫術」,這家中國AI新星用技術與商業策略的組合拳,將成本壓縮至GPT-4的1/20。未來,AI競爭將從「算力軍備」轉向「效率革命」。
Thumbnail
DeepSeek以557.6萬美元訓練成本,顛覆AI行業規則!從「架構瘦身」到「數據煉金」,再到「硬體巫術」,這家中國AI新星用技術與商業策略的組合拳,將成本壓縮至GPT-4的1/20。未來,AI競爭將從「算力軍備」轉向「效率革命」。
Thumbnail
自從DeepSeek R1發表後,有「AI教母」之稱的李飛飛博士團隊在上週發表了一篇「s1:simple test- time scaling」的論文,網上有「標題黨」寫著「只要50美元就能訓練出自己的本地大模型」 事實上50美元只是租用雲端算力的部分支出,團隊在微調模型時用了16張的H100⋯⋯
Thumbnail
自從DeepSeek R1發表後,有「AI教母」之稱的李飛飛博士團隊在上週發表了一篇「s1:simple test- time scaling」的論文,網上有「標題黨」寫著「只要50美元就能訓練出自己的本地大模型」 事實上50美元只是租用雲端算力的部分支出,團隊在微調模型時用了16張的H100⋯⋯
Thumbnail
人工智慧深度求索的真實開發成本 原文来自于: https://semianalysis.com/2025/01/31/deepseek-debates/
Thumbnail
人工智慧深度求索的真實開發成本 原文来自于: https://semianalysis.com/2025/01/31/deepseek-debates/
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News