面對快速發展中的AI (14)

更新 發佈閱讀 6 分鐘

AI技術的研發

之前這系列文章談得比較多的是AI科技對外界的影響,以及普世如何面對AI。讀者可能從很多地方聽到類似的泛泛之論,每個人也都可以擁有自己的觀點,思考及選擇要如何與越來越普及的AI共存共榮。

現在我們來探談一個較小眾的議題:如何開發AI技術?延伸這個議題,之後我們再來談談如何成為協助開發AI技術的人?本土產業能夠做什麼?國家如何培育相關的研發人才?

追蹤此系列文章的讀者,至此應該大致瞭解我所謂對工業生產效率影響極大的關鍵核心AI技術,像是如何讓LLM產生高效率且可信任的軟硬體設計,而我這裡想談的就是這類技術的研發。在此特別聲明,我絕對不是看不起其他的技術專業,只是覺得在廣泛談論AI的同時,也該對AI內部的技術面做一些較深入的探索。

當然,談得較多會是我個人涉獵較多的領域,不過會儘可能以深入淺出的科普形式呈現,讀者不用太擔心。為了簡潔,我會省去對某些術語的解說,想必對這系列文章有興趣的讀者多半會使用AI工具,不必浪費篇幅和彼此的腦力去涵蓋那些可透過AI工具獲得的詳盡解說

要如何讓LLM產生高效率且可信任的軟硬體設計呢?對此,我做了一張高度簡化的概念圖來敘述目前的作法和所需的技術。

LLM的研發

LLM的研發

目前絕大多數知名的通用基礎大型語言模型(Foundation LLM)均來自大型組織或企業,例如Google的Gemini、Meta的 Llama、OpenAI的ChatGPT、深度求索的DeepSeek、阿里巴巴的Qwen、阿拉伯聯合大公國政府主導的Falcon,主要是因為這些從零開始的模型訓練,需要極為龐大的訓練資料集和算力平台,遠超出小公司能力所及

這些基礎模型通常盡可能以豐富、多元的資料集加以訓練,基本上屬於通用型(General Purpose),不過近年來因為競爭的關係,在最終的訓練階段也會輔以額外的優化,讓基礎模型在常見且公開的標竿測試(benchmarks)上表現好一些。這算不算作弊呢?我想,根據標竿測試而改進產品,原本就是業界的常態,因此標竿測試也應該經常更新才好,而使用者不宜全然以標竿測試的結果論英雄。但如果實際使用者的經驗與標竿測試分數之間有很大的落差,可能有損公司的形象,好比最近Meta的Llama 4就因此遭到許多批評。

什麼是更好的模型呢?從一般使用者的角度看,模型回答問題的品質或正確率越高越好,回答的速度越快越好,使用費越低廉越好。但通常智慧程度高、功能強大的模型的反應可能會比較慢,費用也會比較高,除非LLM服務商彼此廝殺到願意賠本打擊對手,那就另當別論。從LLM服務商的角度看,如果在技術上或者經濟規模上能夠以遠較競爭對手為低的成本,提供高於對手的服務品質,那麼贏面就會高出一籌了。

因此在過去這些年,發展LLM的科技巨擘,無不致力於提高模型能力、正確率、品質,研發高效率的模型訓練和推論的方法,以及打造高效率且具經濟規模的AI運算平台。為了贏得這場AI時代的卡位戰,這些科技巨擘都不惜鉅資爭聘專精於上述研發工作的科技人才。

目前已經有不少的基礎模型於網上公開讓人下載使用,這些所謂開放權重(Open-Weight)的模型,多數採用相對寬鬆的授權模式,讓人下載之後能夠加以修改、針對其應用領域進行優化,產生領域特定大型語言模型。例如我們想訓練一個專門用來設計電路的LLM,可以拿一個開放權重的模型,用專門的資料集訓練加以訓練,獲得更專業的效果,來作為特定領域的諮商服務或代理人。

什麼是更專業的效果呢?

首先是提升和確保品質。目前雖然各家廠商致力於提升LLM答題的正確率,但LLM經常為人詬病的通病是幻覺、胡言亂語,即便是在一些標竿測試獲得高分的LLM,仍然有這類的問題。因此除了提高答題的正確率之外,最好還要能確認答案,不然就要有能耐好好處理答案錯誤所衍生的問題。要知道,90%的正確率,還是有10%的錯誤率,就算正確率比人類還高,但所謂「知之為知之,不知為不知」,最好在回答之前先有一個驗證和評估的機制,來確定答案的正確性,或是給予一個信心指數供使用者參考

話說,「知之為知之,不知為不知,是知也」這句話出自於【論語為政篇】,雖然是孔子對子路說的話,但也有針貶世人(尤其是政客)不懂裝懂的通病。通用基礎模型的訓練資料集包山包海,其中很多人產生的,很難確認訓練資料的品質,而這類模型的用途千萬種,又要如何驗證所有可能出現的問題和答案?將模型的用途限縮至特定領域,是較為務實的作法,強化訓練資料集的品質和模型產出的驗證程序的複雜度會較低,若能導入一流領域專家的智慧和協助,應該可以做得更好。

其次是提高訓練和推論的效率。為了上述的提升和確保品質,往往必須不斷加入新的資料,或是採用強化式學習(Reinforcement Learning),來優化模型,雖然限縮到特定的領域對模型做優化所需的資料集和算力成本遠低於訓練通用基礎模型,但成本仍然是重要的考量。尤其是經常需要重複進行的訓練,或是營運規模大幅成長之後,採購平台的成本和電費帳單,或是雲端算力的租用費,攸關公司的利潤,卻往往是新創公司始料未及(或刻意忽視)的議題

如果能夠以較小的模型達成競爭對手採用較大模型才能完成的工作,就可以節省不少優化和營運的設備和算力成本。較大的模型除了增加成本之外,也會導致答題反應速度較慢,像是所謂「殺雞用牛刀」的窘境。此外也可以嘗試優化模型架構(例如混合專家模型)、模型壓縮、軟體優化、軟硬體協同設計、AI專用晶片等方法來提升訓練和推論的效率。

以我所見,國內外仍然極為缺乏擅長於上述工作的科技人才。狹隘地把資訊領域看成只是程式開發,或是利用現成的套件來發展AI應用,未免太短視淺薄了。




留言
avatar-img
留言分享你的想法!
avatar-img
洪士灝的隨筆
68會員
19內容數
隨筆把我的觀察和感想寫出來,透過寫作讓自己腦袋清淨一點、心靈輕爽些。舊文放在https://hungsh-ntucsie.blogspot.com/,文章大多先在臉書上與臉友分享,隨後再轉到這裡臉書網址為:https://www.facebook.com/shihhaohung
洪士灝的隨筆的其他內容
2025/06/19
輔助寫程式的AI(下):LLM彌補了人類使用的自然語言和電腦語言之間的落差,雖然速度比人類快上許多倍,但其速度和效率仍然遠遠不如一般的程式,因此以LLM產生程式,甚至是高效率的軟硬體,將是第四次工業革命的關鍵核心技術。
Thumbnail
2025/06/19
輔助寫程式的AI(下):LLM彌補了人類使用的自然語言和電腦語言之間的落差,雖然速度比人類快上許多倍,但其速度和效率仍然遠遠不如一般的程式,因此以LLM產生程式,甚至是高效率的軟硬體,將是第四次工業革命的關鍵核心技術。
Thumbnail
2025/06/18
輔助寫程式的AI(中):寫程式的人天天在革自己和世界的命,任何與知識經濟(knowledge-based economy)為主的各行各業,在未來都會面臨類似的現實。這個AI時代,可說是擅於自學、自造及研究者的天堂。今天的天助自助者有兩層意涵。
Thumbnail
2025/06/18
輔助寫程式的AI(中):寫程式的人天天在革自己和世界的命,任何與知識經濟(knowledge-based economy)為主的各行各業,在未來都會面臨類似的現實。這個AI時代,可說是擅於自學、自造及研究者的天堂。今天的天助自助者有兩層意涵。
Thumbnail
2025/06/18
輔助程式寫作的AI(上):作為案例探討,我們來聊聊「AI輔助寫程式」。為什麼AI能夠輔助寫程式?能夠達到什麼程度?對產業有多大的衝擊?對從業人員又有什麼影響?
2025/06/18
輔助程式寫作的AI(上):作為案例探討,我們來聊聊「AI輔助寫程式」。為什麼AI能夠輔助寫程式?能夠達到什麼程度?對產業有多大的衝擊?對從業人員又有什麼影響?
看更多
你可能也想看
Thumbnail
在小小的租屋房間裡,透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材,打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖,並推薦蝦皮分潤計畫。
Thumbnail
在小小的租屋房間裡,透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材,打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖,並推薦蝦皮分潤計畫。
Thumbnail
小蝸和小豬因購物習慣不同常起衝突,直到發現蝦皮分潤計畫,讓小豬的購物愛好產生價值,也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異?讓蝦皮分潤計畫成為你們的神隊友吧!
Thumbnail
小蝸和小豬因購物習慣不同常起衝突,直到發現蝦皮分潤計畫,讓小豬的購物愛好產生價值,也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異?讓蝦皮分潤計畫成為你們的神隊友吧!
Thumbnail
人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.
Thumbnail
人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
AI技術的發展如日中天,但也引發了許多道德與創作者權益的議題。從初期到現在的變化,AI的發展對創作者而言是一大挑戰,無論是哪種AI使用者,AI的出現,不代表我們要放棄思考。
Thumbnail
AI技術的發展如日中天,但也引發了許多道德與創作者權益的議題。從初期到現在的變化,AI的發展對創作者而言是一大挑戰,無論是哪種AI使用者,AI的出現,不代表我們要放棄思考。
Thumbnail
2024年第一季這波台股與美股的強勢上漲,其實都能歸功於AI這個未來趨勢,不過在AI一片看好之下,也有非常多人對這個產業趨勢感到憂心。
Thumbnail
2024年第一季這波台股與美股的強勢上漲,其實都能歸功於AI這個未來趨勢,不過在AI一片看好之下,也有非常多人對這個產業趨勢感到憂心。
Thumbnail
從去年開始,AI 成為了顯學,無論是投資市場、工作習慣、生活環境,強 AI 已然成為無法分割的一環,我們不難預見,這樣的存在必然會如智慧型手機那般,普及全球,甚至深入生活的方方面面。
Thumbnail
從去年開始,AI 成為了顯學,無論是投資市場、工作習慣、生活環境,強 AI 已然成為無法分割的一環,我們不難預見,這樣的存在必然會如智慧型手機那般,普及全球,甚至深入生活的方方面面。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
人工智慧(AI)的未來展望 在當今這個科技日新月異的時代,人工智慧(AI)已成為推動創新和進步的重要力量。從自動駕駛汽車到精準醫療,AI的應用範圍不斷擴大,其潛力無限。然而,隨著AI技術的快速發展,我們也必須關注其對社會、經濟和倫理的影響。
Thumbnail
人工智慧(AI)的未來展望 在當今這個科技日新月異的時代,人工智慧(AI)已成為推動創新和進步的重要力量。從自動駕駛汽車到精準醫療,AI的應用範圍不斷擴大,其潛力無限。然而,隨著AI技術的快速發展,我們也必須關注其對社會、經濟和倫理的影響。
Thumbnail
本文介紹了人工智慧的定義和發展,以及在醫療、金融、製造、交通、教育等領域的應用。探討了AI的優勢和挑戰,以及AI在未來社會中的角色。作者提出了對AI發展的個人觀點和建議,強調了謹慎發展AI並制定相關法律法規的重要性。
Thumbnail
本文介紹了人工智慧的定義和發展,以及在醫療、金融、製造、交通、教育等領域的應用。探討了AI的優勢和挑戰,以及AI在未來社會中的角色。作者提出了對AI發展的個人觀點和建議,強調了謹慎發展AI並制定相關法律法規的重要性。
Thumbnail
人工智慧(AI)是當今科技領域最炙手可熱的話題之一,這項技術正在改變我們的生活方式、工作方式以及與科技互動的方式。本文將深入探討AI的意義、生成式AI的概念、AI在生活中的應用案例,以及一些熱門的AI產品。藉由這趟AI之旅,我們將更深入了解這個讓世界為之矚目的技術。
Thumbnail
人工智慧(AI)是當今科技領域最炙手可熱的話題之一,這項技術正在改變我們的生活方式、工作方式以及與科技互動的方式。本文將深入探討AI的意義、生成式AI的概念、AI在生活中的應用案例,以及一些熱門的AI產品。藉由這趟AI之旅,我們將更深入了解這個讓世界為之矚目的技術。
Thumbnail
在人工智慧(AI)領域中,生成式AI已經成為一個備受關注的分支,它不僅在創造性的工作中展現出強大的能力,還在各個領域中展現出潛在的應用價值。本文將從宏觀的角度出發,深入探討生成式AI的種類、概念、缺點、公司、訓練、發展趨勢以及原理,帶領讀者深入了解這個令人振奮的領域。
Thumbnail
在人工智慧(AI)領域中,生成式AI已經成為一個備受關注的分支,它不僅在創造性的工作中展現出強大的能力,還在各個領域中展現出潛在的應用價值。本文將從宏觀的角度出發,深入探討生成式AI的種類、概念、缺點、公司、訓練、發展趨勢以及原理,帶領讀者深入了解這個令人振奮的領域。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News