各位讀者大家好,最近我在方格子上分享了一系列關於DeepSeek的專文,除了新接觸了一些格友外,在我自己的生活圈也引起了不少迴響。今天我想藉此機會,和大家聊聊我從開始寫DeepSeek這個專題時,想表達個人對AI發展的一些觀察與思考。
DeepSeek系列文章在生活中引起一些討論
AI應用在當今社會已成為一種常態,無論新聞、報章雜誌或網路媒體,都能看到許多關於AI如何影響我們生活的討論。然而,真正能將AI應用於生活甚至職場的比例,在台灣社會可能還有很大的推廣空間。
隨著DeepSeek的問世,引發了不少爭議,尤其是關於其與OpenAI之間採用蒸餾技術,是否涉及竊取或利用他人研究成果來提升模型訓練效率的問題,引起了廣泛關注。相關技術文件和網路討論也持續發酵。
DeepSeek的發表,無疑對近一兩年來許多大型公司在AI領域投入重資本規劃的商業模式產生了巨大衝擊。這或許也是NVIDIA股價在DeepSeek發表後大幅下跌的原因之一。當然,隨著對DeepSeek技術文件的了解以及實際使用上的感受,股價後來也逐漸回穩。
若要用一個比喻,DeepSeek有點像早期我們在安裝Windows時所發布的「綠色版」概念。畢竟,在中國大陸,若沒有翻牆,很難使用Google或ChatGPT等工具。因此,我認為DeepSeek的發展,更像是要面向中國大陸用戶的AI模型。
DeepSeek免費提供大家使用,但其處理效率,正如官方所言,由於使用較低階的硬體配置,在相關議題的處理效率上的確不如預期。然而,在內容方面,DeepSeek卻能與OpenAI相提並論。
許多朋友在看完我的文章後,除了討論DeepSeek的模型應用與OpenAI的差異外,也提出了其他方面的回饋。我認為這些技術上的討論和應用領域的發揮都是正向的。我也因此受邀到學校與學生們討論、分享DeepSeek、OpenAI甚至Gemini的使用比較。
對於任何新工具的出現,我都抱持著開放態度,希望透過了解和深度認識,來決定如何在生活中應用。也歡迎大家一起交流。
然而,也有部分意見質疑我為何要為DeepSeek宣傳。首先,我必須澄清,我並非技術背景的工程師,只是對AI有些興趣,著重於其應用面。我了解一些簡易的編碼,也對背後的邏輯相當感興趣,但實際上並未參與任何模型的開發。因此,DeepSeek這間公司賺錢與否,對我沒有任何影響。
有人認為我在文章中過於吹捧DeepSeek。對此,特別回顧這幾天寫的內容,我的重點在於討論DeepSeek的出現對人工智慧的衝擊,以及現在大家使用AI工具有了新的選擇。我並不認為DeepSeek是目前最頂尖的AI工具,也沒有拿它與其他工具比較,也沒表示過「除了它以外其他AI工具都是死要錢的廢物」。相反地,我在文章中也特別提到,由於DeepSeek可能採用了蒸餾技術,因此其模型文件來源有可能是來自ChatGPT。
一個AI模型若沒有大數據的訓練,要單純靠後面的推理,而不「借助」其他系統的數據基礎,要使其成熟其實技術上有相當程度的難度(至少目前如此),但不代表所有的學習都必須從頭來一遍。就如同我們人類社會一樣,面對生活中所需的知能,不需要重新再回去學老祖宗如何建構知識的歷程,反而只需要在他們的研究成果或發現的結果上持續往下推進人類文明的知識與進步,這就是智慧發展的方式,同樣地AI發展也是如此。
或許你會覺得DeepSeek發展模式取巧,或許你會對拿它來應用的人嗤之以鼻,我都尊重,因為都是個人的選擇。對我而言,我只需要知道別人的科技如何進步、如何發展、如何成長,以及為什麼別人做得到而我們卻沒有發展出來。這種深刻的反省,是我與幾位做數據應用分析的朋友在討論時偶爾會碰觸思考的方向。
也有人說我只在幫中國大陸的技術吹捧。就實際來說,我與中國大陸沒有額外利益,也不需要幫他們做大外宣。我認為技術回歸技術是最單純的一件事情。在網路時代,尤其在台灣社會,只要牽涉到某些關鍵字,就容易引起一些人膝跳式的反應,而忽略了背後的本質是什麼。
如果我說AI的蒸餾技術在台灣有很多的AI公司也在使用這樣的技術發展自己的模型,你會相信嗎?蒸餾這件事情本身就不是DeepSeek的獨家專利,而是這個領域常用的技術之一,只是DeepSeek做得更完整、更有規模,然後它發表、可以收費了。
假如今天DeepSeek是台灣發布的,會不會說這又是另外一種台灣之光,就像中國大陸現在對於DeepSeek這套系統感到與有榮焉一樣的感覺?但這套系統完美嗎?大家都知道它並不完美。但它像真的是一種實驗性的性質、新的技術面向以及可能嘗試的可行性。畢竟在那之前,很多單位都做了相似或相仿的研究,只是在DeepSeek之前,還沒有人能夠如此大規模地向世界發表。
如今,DeepSeek作為另一種發展途徑的可行性發布,對我而言,本身並不代表著只是他們團隊的成功,也給予這些在使用相同技術或類似裡面的AI團隊,他們未來在發展的過程當中,不管是對於資方或是對整個社會解釋交代他們在做的事情,能夠有一個更輕鬆的一個解釋空間以及樣板來說明的範例。
在台灣,可能很多時候我們因為政治因素的關係,所以在看待中國大陸的一些科技發展或技術突破,多少會帶著一些擔憂,而無法真正有效地看到他們的本質是什麼。當然,這並不表示除了在台灣的人以外,就能夠坦然安心地去使用中國大陸的科技。美國、歐盟甚至是相關的競業,對於大陸技術的發展也會有一些關注,只是他們討論的方向可能跟我們截然不同。
在競爭的賽道上,如果只會攻擊對手或是嫌棄對手的東西,而沒有辦法回過頭來檢視目前自己的發展,這是一件很恐怖的事情。因為差距已經在那裡,多罵、多抱怨,甚至嫌誤,並不會使自己的技術更加的進步與發展。
花時間客觀地去了解、深度地去檢視,才能夠了解崛起的原因以及背後可能潛藏的條件以及環境的因素。這才是有可能在競爭的賽道上面能夠重新追上對方,甚至超越對方的關鍵。
回過頭來,對於DeepSeek這一系列,我今天想跟大家分享的結論是,也許你看不起中國大陸的DeepSeek,也許你不喜歡我介紹DeepSeek的應用與分析,這些我都尊重。
只是科技在進步,我只想回到技術面去看一個產業的發展,以及在人類生活典範轉移的過程當中,我們如何有幸地去看待這發展過程當中的一切。
畢竟,隨著資訊時代的來臨,人類生活典範的轉移已經到了呈現指數級成長的一種發展速度。從過去漁獵、農業、工業到資訊社會,我們生活的環境與模式正在快速地翻轉。這一切都是我們現在的進行式。我們的祖先可能拚了一輩子都看不到這種典範轉移,但至少從我小到大,已經經歷了不下四到五次以上的快速改革時代。
回想,儲存設備從1.44軟碟片到雲端、網速從撥接到5G、汽車從自然進氣到智慧駕駛,至少對我這一代人而言,人類的進步與發展是很有趣的觀察,我也樂在其中。這是我從DeepSeek的發布以後,之所以發布一系列文章的核心態度。
以上內容跟大家分享,可能最近感慨過多,所以這篇文章寫得有點長,感謝花時間看完的朋友。如果你有些想法或建議,歡迎跟我分享,那我們就下次見。