中國 AI 新星 DeepSeek 最近傳出,新一代 R2 模型本來 5 月就該登場,結果一路拖到現在,原因竟然是華為晶片「太弱」!
知情人爆料,DeepSeek 在今年 1 月發完 R1 後,受到中國官方鼓勵,想捨棄輝達(NVIDIA)改抱華為昇騰(Ascend)處理器的大腿,試圖在「去美化」的浪潮中當模範生。
結果呢?R2 訓練過程頻頻出包,最後還是只能回頭用輝達晶片完成訓練,華為晶片只好退居推理(Inference)階段。
業界都知道,訓練是 AI 模型的核心戰場,推理只是後續應用。這意味著,中國晶片在最關鍵的環節還是比不上美國貨。就算華為派工程師駐場幫忙,DeepSeek 還是一次都沒在昇騰上完整跑完訓練,最後只好改成「推理相容」聊表合作誠意。
據說,創辦人梁文峰對進度超不爽,覺得自己在 AI 競賽裡被迫「減速」,再加上資料標註工作比想像中拖更久,R2 才遲遲未面世。
外媒還爆,北京現在要求買 NVIDIA H20 晶片得先上繳「理由書」,想推華為、寒武紀等國產貨上位,但中國科技業界吐槽本土晶片就是穩定性差、速度慢、軟體生態跟不上。
有專家笑說,還沒看到華為晶片訓練出頂級模型,不代表未來不行,都只是時間問題。

























