成為協助開發關鍵核心AI技術的人
上回提及較硬派的核心AI技術的研發工作,例如針對特定領域優化LLM,並且進行驗證與評估,如果要做得比競爭對手好的話,恐怕不是簡單的事情。這一回,我們來談談,如果想成為協助開發關鍵核心AI技術的人,有哪些技能是值得學的。
首先,我們要知道LLM跟上世代由卷積神經網路(CNN)為主的AI模型有很大的差異,所需的核心技術也有所不同。同樣是所謂的類神經網路,但規模相差太大,以致於LLM相關的研發工作在實務上會更重視資料集、計算效率以及大型算力平台。我絕非嫌棄CNN,更不是叫大家不要去學。CNN能夠妥善解決的問題,何必用到需要大量算力的LLM?事實上,除了類神經網路之外,還有不少可以用來打造AI的演算法,例如SVM、決策樹、迴歸、隨機森林、K-NN、K-Means、PCA、Boosting,乃至於上世紀末關注的啟發式搜尋、專家系統、演化等演算法,也許不是當前熱門研究議題,但各有其特色和實際應用場景,可以多涉獵一下。
台大資工系開給大三學生修的「人工智慧導論」,是帶領本系學生接觸AI領域、傳授核心知識的入門課程,會重點式涵蓋上述的演算法。課程在有限的時間中,不大可能、也沒必要窮盡列舉所有的演算法,學生要學到精髓,能夠觸類旁通才好。
修過人工智慧導論之後,可以選修進階的課程。以台大來說,不少系所的教授開授人工智慧的課程,而我個人會把進階課程概略分為兩類:應用類和核心技術類。
從台大課程網可以看到不少應用類的課程,例如:人工智慧與商業數據分析、人工智慧在健康照護概論、人工智慧之建築實務應用、人工智慧應用於口腔醫療之概論、人工智慧與醫療科技在高齡長照的應用... 有越來越多的教授利用AI作為探索或解決特定領域的工具,這是符合時代潮流的作法。
相較之下,核心技術類的進階課程看起來沒有應用類課程那麼多采多姿,大多數都是研究導向的,搭配授課老師的研究專長。資工系目前提供的進階課程有:自然語言處理、機器學習、深度強化學習、高等深度學習、分散式機器學習系統、可信賴之人工智慧、高效能巨量資料與人工智慧系統等,大部分課程會較深刻地探討AI領域中的特定技術議題,如何設計出高效率的模型、有效率地訓練模型、提高模型的準確度和可信賴度、以高效能平台訓練更大的模型。
不要小看、也不要高估這些進階課程,一方面這些課程通常會運用到資工領域的基礎,包括數學、演算法、作業系統、計算機結構,甚至涉及平行計算、資訊安全,我會說基礎廣博且扎實的學生可能在同一門課中學得比同儕更多,尤其對那些仍在快速演進的領域進行探索時,基礎相當重要。另一方面,即便是進階課程,以一學期的時間,所能教的東西仍是相當有限,最好還是跟著指導教授做研究,才能真的要深入其中。
迄今需要進階人才的地方以大型組織和企業為主,上回提到一些科技巨擘以鉅資爭聘各類好手。資工系訓練出來的AI人才,很多都被外商和國內大廠以高薪網羅,以至於較小的地方聘不到人。我說目前發展領域特定的LLM和AI Agent,也會需要相關的人才,一開始可能以建置模型和工作流程為主,規模大了之後可能會需要提高訓練和推論的速度和效率,還會需要利用高效能平台、AI晶片等,如果要與強大的對手競爭的話。
以上所談的專精路線,當然不見得適合每個人,可能要有相當的資質、有熱情、願意花時間鑽研最新技術,才能在這場目前相對迅猛的研發戰場上有所表現。
