AI 發展的敘事邏輯

更新 發佈閱讀 9 分鐘
投資理財內容聲明

今年七月,我跟指導教授在土城開 AI 結合 ESG 的課;我們負責 ESG,AI 的課由資訊顧問公司的專家負責。開課單位發現我有 iPAS AI 應用規劃師的證照,她們問我能不能開 AI 的課。在溝通的過程中,我發現她們想開的是那種「教你用各種 AI 應用工具」的課。

只要願意上網搜尋,你要 15 種或是 150 種工具,我都可以生出來。對我來說那些課誰都可以開。消費者真正需要的是使用 AI 的策略

這個系列就是 AI 應用策略課。

核心問題:AI 會取代人類嗎?

自從 AI 能夠處理人類的語言、能夠與人類自然對話之後,就產生一個問題:AI 有沒有可能取代人類?有沒有可能 AI 就能做人類做的工作?如果 AI 可以做這些工作,那還要人類幹什麼?

學習使用任何工具的時候,我都先問一個問題:這個工具的運作邏輯是什麼?接觸現在這種 AI 的時候,我第一個問題就是:當代 AI 的運作邏輯是什麼?我們現在講的人工智慧,智慧在哪裡?

也就是說,要先理解當代 AI 發展的敘事邏輯,才能知道現在充斥的 AI 應用,本質到底是什麼。

人們如何思考機器智慧

自從打孔卡片式的電腦發明以來,人們就在思考:如果機器可以算數,那麼機器能不能思考,跟人類一樣?

圖靈測試 Turing Test

為了判斷機器能不能思考,1950 年 Alan Turing 提出圖靈測試(Turing Test)。Benedict Cumberbatch 演的電影《The Imitation Game》(模仿遊戲,2014)就是講圖靈的故事。有些人認為圖靈被壓迫是因為他是同性戀,但我認為同性戀只是一個藉口;圖靈太聰明了,導致別人想要壓迫他。

什麼是圖靈測試呢?簡單地說,就是讓人類專家與普通人類和人工智慧分別對話;如果專家沒有辦法區分哪一個談話對象是人類、哪一個是人工智慧的時候,我們就認為這個人工智慧具有跟人類一樣的智慧。

而現在的 LLM,對圖靈來說,很可能具有跟人類一樣的智慧。這就進一步牽涉到中文房間問題。

中文房間 Chinese Room

在人工智慧研發的領域,有一個很有名的問題叫中文房間(Chinese Room),1980 年由 John Searle 提出。中文房間的問題是這樣子的:

你眼前有一個有窗口的小房間,裡面有個人。你把中文書寫的問題紙條遞進窗口,一段時間後屋子裡的人會把中文書寫的答案紙條遞出來,而且答案符合你的問題。對你來說,屋子裡的人應該懂中文,對吧?

事實上,中文屋裡面的人不懂中文,但屋子裡有各種中文的詞彙和語法規則。當屋子裡的人收到你的問題時,他利用屋子裡的詞彙和語法規則理解問題,然後將答案用正確的中文詞彙和語法規則組織起來,成為你看到的中文答案。你看不到屋子裡的運作情況,你會認為屋子裡一定有人懂中文。

中文房間問題促使人們思考:有沒有可能建造一種機器,裡面裝滿某個知識領域的一切資訊,當我們對這個機器提出問題的時候,機器就會根據那些知識,組織成我們需要的資訊?如果這個運作過程順利,這個機器就相當於具備能夠跟人類對答的智慧——即使它不「懂」任何東西。

而現在的 AI ,顯然可以用中文回答任何問題。所以現在的 AI 已經具備智慧了嗎?

從 NLP 到 LLM

當我們研究電子元件構成的機器如何理解人類語言的時候,我們的工作叫做自然語言處理(NLP, Natural Language Processing)。

NLP 要面對的問題

人類語言的元素是有限的:英文 26 個字母;越南字母 29 個,聲調六種;日文平假名片假名共約 100 個;中文的注音符號 37 個,聲調五種,但日常用字至少兩千字。這些有限的語言元素,可以組合成無限的詞彙和句子,任何一個自然人都可以輕易地用自己的母語,創造無窮多的句子。我們要怎麼樣讓機器理解人類所創造的、無窮無盡的可能性,並且產生適當的回應?

早期做法:ELIZA 與停用詞

能夠跟人類對話的機器其實早就有了。當年最有名的叫 ELIZA(1966 年,MIT 的 Joseph Weizenbaum 開發),ELIZA 可以跟你聊天,你講一句它講一句。ELIZA 如何回答人類的句子?它其實是抓使用者輸入句子當中的關鍵字。例如「我吃過飯了」,它抓的關鍵字是「吃」跟「飯」。你提到吃飯,它就回應吃飯有關的句子。

那「我」「過」「了」這些詞呢?這些詞出現的頻率太高了,會讓電腦以為有這些詞的句子都是相關的,而且當時電腦運算性能不強,所以當時的做法是:只處理「吃」「飯」這種有主題意涵的詞彙,「我」「過」「了」這些無法用來區分主題的詞彙叫做停用詞(stop words),遇到就不處理。

這是 2010 年代以前自然語言處理的做法。

轉折點:AlphaGo 與 Transformer

2016 年 3 月,AlphaGo 以 4:1 擊敗世界圍棋冠軍李世乭。我個人把 2016 年 AlphaGo 的成功當作新一代 AI 發展的里程碑,展現人們重新思考「機器思考」的原理。

圍棋是人類發明過最複雜的遊戲,可能局面數超過 10^170,比宇宙中的原子數還多。但人類語言的可能性更多。那麼 NLP 這個領域有什麼突破呢?

2017 年出現了 Transformer 架構(Google 發表論文《Attention Is All You Need》)。在 Transformer 的框架之下,機器不再忽略那些看似沒有實質意義的詞彙。它可以區分「我吃飯」跟「我吃過飯了」這樣的句子,能夠判斷「過」「了」這樣的語法詞彙對句子意涵的影響。停用詞的時代過去了,注意力機制的時代到來了。

而對我這個認知心理學愛好者來說,注意力就是一切。正確的注意力分布,意味著正確的認知方式。當代的 AI 以注意力機制為基礎,那麼機器的注意力會如何運作?

LLM 的本質

當前的 AI,事實上是大語言模型 LLM(Large Language Model)。

什麼是 Model

Model 是一種處理變數的工具;如果你輸入 A,模型會輸出 B。如果:

f(x) = x+1,g(x) = x × 2

當 x = 2,

f(x) = 3,g(x) = 4

Model 的內容不同,輸出就不同。

大語言模型叫做語言模型,代表它可以處理人類的語言。但很多人不知道一件事:大語言模型也只能處理語言。

LLM 只能處理語言

可是,現在很多 AI 可以處理圖片啊?

如果你自己訓練或微調過 AI,你會發現大語言模型本身根本只能處理語言,或者說文字 text。想要用 LLM 處理圖片、聲音、影片,都要在 LLM 外面掛上一堆程式工具,讓 LLM 可以理解這些多媒體訊息。如果沒有這些工具,LLM 連 PDF 都無法理解。但如果你把 PDF 的文字內容複製貼給 AI,任何 AI 都可以理解。

這就是為什麼 AI 文生圖(text-to-image)、文生影(text-to-video)的服務都相當昂貴——生出影像本身就是很困難的事情;不只是對你,對電腦也是一樣。

「大」是有多大

大語言模型的「大」是什麼意思?它的訓練資料集很大。

我時常與 Claude 討論小說。有一次 Claude 說,她是「人類寫作經驗的集合體」。然後我發現她是對的;沒有人類可以像她一樣看過那麼多小說。

大語言模型看過世界上所有它能夠看到的東西。網路上的資料,只要 AI 公司可以用爬蟲程式抓下來,就可以成為 AI 的訓練資料集。「大」語言模型真的很大,它背後的訓練資料遠超過任何單一人類的知識。

一句話解釋 LLM

如果要我用一句話解釋大語言模型,我會說:

所謂的大語言模型是這樣的東西:它看遍人類寫作成果、能夠用你的語言生成滿足你需求的回答。

工作機制:文字接龍

但到現在為止,我們只討論了當代 AI ,所謂大語言模型的工作流程,我們還沒說到大語言模型的工作機制。容我引用李宏毅教授的說法:

大語言模型的工作機制其實就是文字接龍

只要你能夠理解這句話,你就能夠理解:為什麼現在的 AI 經濟很可能是一場新時代的科技泡沫,就如同當年的 .com 泡沫一樣。


留言
avatar-img
Royal Club
3會員
21內容數
探討敘事邏輯的威力與邊界。
你可能也想看
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
人工智慧源於20世紀初圖靈等人對計算與神經網絡的理論探索。1956年達特茅斯會議正式命名「人工智慧」,符號推理與專家系統興起,卻在1980年代因過度期待與技術瓶頸陷入「AI 冬天」。1990年代資料驅動與統計學習崛起,1997年深藍擊敗世界棋王成為象徵。
Thumbnail
人工智慧源於20世紀初圖靈等人對計算與神經網絡的理論探索。1956年達特茅斯會議正式命名「人工智慧」,符號推理與專家系統興起,卻在1980年代因過度期待與技術瓶頸陷入「AI 冬天」。1990年代資料驅動與統計學習崛起,1997年深藍擊敗世界棋王成為象徵。
Thumbnail
深入解析了 DeepMind 的紀錄片《The Thinking Game》,從策略、哲學和倫理三個維度剖析了其走向通用人工智慧的獨特路徑。文章回顧了 DeepMind 如何利用遊戲作為訓練場,在圍棋、星海爭霸中展現 AI 的創造力與複雜性,最終在蛋白質摺疊領域取得科學突破(AlphaFold)。
Thumbnail
深入解析了 DeepMind 的紀錄片《The Thinking Game》,從策略、哲學和倫理三個維度剖析了其走向通用人工智慧的獨特路徑。文章回顧了 DeepMind 如何利用遊戲作為訓練場,在圍棋、星海爭霸中展現 AI 的創造力與複雜性,最終在蛋白質摺疊領域取得科學突破(AlphaFold)。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
人工智慧(AI)的發展從 20 世紀中期的圖靈測試開始,經歷了兩次 AI 冬天與多次技術革命,終於在深度學習與大數據技術的推動下迎來爆發。從 IBM 深藍戰勝棋王,到 AlphaGo 擊敗圍棋世界冠軍,再到 ChatGPT 引領生成式 AI 浪潮,每個重大突破都改變了科技與社會的未來。本篇文章將帶你
Thumbnail
人工智慧(AI)的發展從 20 世紀中期的圖靈測試開始,經歷了兩次 AI 冬天與多次技術革命,終於在深度學習與大數據技術的推動下迎來爆發。從 IBM 深藍戰勝棋王,到 AlphaGo 擊敗圍棋世界冠軍,再到 ChatGPT 引領生成式 AI 浪潮,每個重大突破都改變了科技與社會的未來。本篇文章將帶你
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
人工智慧的重要里程碑 人工智慧(AI)的發展歷程充滿了重要的里程碑,這些里程碑不僅推動了技術的進步,也深刻影響了社會和經濟。 以下是一些關鍵的歷史事件和成就: 早期發展 1943年:麥卡洛赫(McCulloch)和皮茲(Pitts)創造了第一個人工神經元,這一概念為後來的神經網絡
Thumbnail
人工智慧的重要里程碑 人工智慧(AI)的發展歷程充滿了重要的里程碑,這些里程碑不僅推動了技術的進步,也深刻影響了社會和經濟。 以下是一些關鍵的歷史事件和成就: 早期發展 1943年:麥卡洛赫(McCulloch)和皮茲(Pitts)創造了第一個人工神經元,這一概念為後來的神經網絡
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News