這陣子忙碌逐漸告一段落,準備回來整理這段時間忙碌心得,而今天,我想先跟大家聊聊一個最常聽到但卻可能不是真的很明白的一個詞彙—「生成式AI」開始聊起。
前一陣子我寫了不少關於AI應用或發展相關的文章,設定的基準是大部分讀者都有一些基礎AI概念,再進一步去討論相關應用。雖然這些基礎概念或AI運作「原理」可能不是應用AI時一個必備觀念,但當這幾天遇到一位朋友問我:「AI是不是會一直自動學習?那它學習到後來會變得多強大?」
我好奇這背後提問的邏輯。他告訴我,一位工程師告訴他,所謂生成式AI就是一段不用人下指令,它會自動學習的一段程式。聽到這句話,忍不住想跟大家解釋清楚生成式AI究竟是什麼。想像一下,生成式AI就像一個非常有才華的學生,這個學生之所以能創作出好作品,是因為他讀了大量的書籍、看了很多的畫作、聽了無數的音樂。這些「大量的書籍、畫作、音樂」就是AI學習的訓練資料。
生成式AI,是「創造者」而非「自動機」
很多朋友會誤以為生成式AI可以自己決定要做什麼,不需要人類介入。這其實是個大大的誤會!就像那位有才華的學生,你必須告訴他:「請你寫一首關於思念的詩」、「請你畫一張夢幻城堡的圖」,他才能開始動筆。這些「請你寫」、「請你畫」的指令,就是我們給AI的輸入(Prompt)。
所以,生成式AI並非「不用人下指令」,它非常依賴我們給出的指令來「創造」內容。它真正的強大之處在於,它能根據這些指令,生成出全新的、以前不存在的東西。比如,你給它幾個關鍵字,它就能寫出一篇流暢的文章;你描述一個場景,它就能畫出一幅精美的圖片。這就像學生在吸收大量知識後,能寫出自己的新詩,而不是簡單地抄襲舊詩。
AI如何「理解」我們的語言?認識「Token」
那麼,AI怎麼理解我們說的話呢?它不是真的懂中文或英文,而是將我們輸入的文字拆解成一個個小單位,這些小單位就是「Token」。
你可以把Token想像成是AI世界的「基本詞彙」或「積木」。當我們說「哈囉,你好嗎?」這句話時,AI可能會將它拆解成「哈」、「囉」、「,」、「你」、「好」、「嗎」、「?」等幾個Token。每個字、標點符號甚至是一小段詞語,都可能是一個Token。
AI在學習的過程中,就是透過這些Token來理解文字的意義和彼此的關聯。它會學習到「哈囉」通常用來打招呼,「你好嗎」是詢問近況。當你給它新的指令時,它也是將指令轉換成Token,然後根據它學到的Token之間的複雜關係,去「預測」接下來最有可能生成的Token是什麼,最終組成我們看到的文字、圖片或程式碼。
生成式AI的學習,是為了更好地「預測」與「創造」 所以,當那位朋友問:「AI是不是會一直自動學習?那它學習到後來會變得多強大?」這句話的前半段,如果指的是AI在訓練階段會不斷吸收大量資料來提升能力,那是對的。但這不代表它在使用時可以自行運作。
生成式AI的強大,來自於它從海量數據中學習到的複雜模式和規律。這種學習讓它能精準地「預測」下一個最可能出現的詞彙或像素,進而「創造」出連貫且符合邏輯的新內容。這就像那位資優生,因為廣泛閱讀和練習,所以才能寫出各種主題的優秀文章。
總而言之,生成式AI是一個需要人類引導的強大「創造工具」。它不會自動運作,而是透過學習海量資料並將我們的指令分解成「Token」,來幫助我們實現各種文字、圖片、甚至程式碼的生成。
理解這些基本概念,能幫助我們更好地駕馭和應用這項令人驚嘆的科技,未來有機會付費購買相關服務時,你會更清楚自己買到了什麼。












