近期,中國新創公司Deepseek發表了 DeepSeek- V3 和 DeepSeek- R1 兩款模型,據報導指出,其性能與Open AI相當;此報導一出,Nvidia等相關公司股價陸續出現重挫;究竟Deepseek是什麼公司?為何會讓全球為之震撼?而後又會造成什麼影響?今天透過這篇文章讓讀者們簡單了解這起事件的來龍去脈。
DeepSeek背景
DeepSeek是一家源自於中國的AI新創公司,其創辦人『梁文鋒』現年只有40歲,1985年出生,國中時期就提前完成了高中數學課程,並提早開始學習大學數學,可謂是個不折不扣的天才,高中畢業後,進入浙江大學研習電子資訊工程,並且於畢業後繼續攻讀相關課程研究所;2008年梁文鋒便開始帶領團隊學習相關技術,至2023年成立了DeepSeek公司,在短短一年後,該公司就推出了令業界震撼的產品,陸陸續續發表了數款模型,其創新架構與低成本優勢引發了AI圈的廣泛注意。
圖片截至DeepSeek官方網站
為何引起震撼
據報導指出,DeepSeek所發表的模型,其成本僅為560萬美元,相較於OpenAI的超過1億美元可謂是天差地別,相較於美國公司所必須花費的成本,DeepSeek已經占據極大優勢與領先地位;同時,業內人士也指出,訓練DeepSeek的模型只需要5500萬美元,而業界則需要數十億美元才能達到,可想而知,其成本的巨大差異,會整個改變現在的AI科技,有媒體以『改變AI生態圈』來形容這次DeepSeek的崛起。
此事件可能產生的影響
簡而言之,DeepSeek的進展讓許多人開始質疑大規模投入AI基礎建設的必要性,一家公司僅僅用較低規格的輝達(Nvidia)晶片即可達到相同或類似的效果,那是否可能造成業界不再大量投資,這個疑問無疑衝擊了市場對輝達(nvidia)的信心;而有分析師指出,DeepSeek的確創造出優秀的模型,但說因此改變了整個生態圈似乎誇大了點,也有人質疑還有許多的成本未公開。而輝達(nvidia)在第一時間也公開聲明,表示該公司未來會需要更多的GPU與高效網路。因此,後續發展仍須關注,現在判定會顛覆AI的發展環境仍言之過早。
(以上資訊由筆者綜合個人意見整理歸納,如有錯誤,麻煩不吝指正。)