2024/12/28
DeepSeek V3 模型的推出與市場影響
相關新聞 : 最強開源 AI 模型之一!DeepSeek-V3 GPU 時間比 Llama 3 少 11 倍
引言
中國AI公司DeepSeek推出的V3模型在市場上獲得高度評價,儘管受到全球禁令的限制,其模型依然展示出高度的競爭力和潛在的市場影響。以下是對其技術能力、成本優勢及對全球AI市場的潛在影響進行的分析。
DeepSeek V3 的技術突破與成本優勢
使用有限硬體達成高效訓練
DeepSeek V3模型使用了超過2000顆H800 GPU進行訓練,假設每GPU小時費用為2美元,總訓練成本僅約557萬美元。相比之下,同樣是開源模型的LAMA 3.1(405B),使用了16000顆H100 GPU,不僅硬體規格更高,數量更多,成本更是數十倍於DeepSeek的模型。
NVLink的影響
儘管H800 GPU的互聯速度僅為H100的約一半(400GB/s對比900GB/s),DeepSeek仍能在這樣的限制下達成可用的模型性能,這顯示了其在資源受限下的高效應用能力。
然而,這樣的限制在訓練效率上可能導致更長的時間與更高的總成本,這也是其與國際領先AI技術的主要差距之一。
DeepSeek V3 對市場的潛在影響
成為市場新基準
DeepSeek V3的推出不僅在中國內部具有重要意義,還可能對全球AI市場帶來影響。該模型展示了在有限資源與禁令下仍能實現高性價比AI訓練的能力,為AI模型開發設立了一個新的成本基準。
市場競爭格局的改變
儘管美國及其盟國可能基於政策和安全考量而拒絕採用中國AI模型,但DeepSeek的成功可能會迫使全球AI技術供應商重新評估其資本支出(CAPEX)計劃,特別是在「何時能夠盈利」與「成本效率」上的雙重壓力下,尋求新的策略應對。
AI資本投入的風險
當市場處於高成本投入但回報未明的階段,股東和投資人對資金回報的關注可能引發更大的市場波動。如果AI技術發展的投入無法匹配市場預期,可能導致更多負面情緒蔓延至整個科技行業。
AI市場的未來觀察與風險管理
供需失衡的警訊
目前,AI與半導體市場正逐漸顯露供需失衡的跡象,從過去的供不應求轉變為可能的供過於求。這種變化要求市場參與者更加謹慎,尤其是在庫存管理和生產規劃方面。
預期對資產配置的影響
未來一段時間內,投資者可能需要重新審視其投資組合,對於高風險部位設置交易止損(Trading Stop),並提早重新評估其資產配置策略,以降低可能的市場波動風險。
—來自股市癲瘋 IV伊凡發佈於股市癲瘋 https://vocus.cc/article/676fff1efd8978000153b7f8