AI 憑什麼這麼強 (一):人工智能模型的湧現現象

更新於 發佈於 閱讀時間約 6 分鐘
Photo by Shahadat Rahman on Unsplash
本文長2080字,回答幾個問題:
(一) 什麼叫做湧現;(二)湧現是什麼現象;(三)為什麼我們造不出自己的超級 AI。
看完後,你會理解現在 AI 的現象跟趨勢、一些技術與專有名詞,像是參數、大型機構與他們模型的名字。
---------正文開始---------
前陣子準備演講時,找到一份Google與史丹佛大學做的有趣研究,講到 AI 的湧現 (Emergent Ability)。
AI 領域的湧現現象,展現在機器突破某個臨界值之後,變得格外強大,運算系統產生很多難以理解的現象或反應,使得我們感覺機器彷彿有著人的智慧。

|湧現與模型的超凡表現

臨界值又是以甚麼為判準呢?這份研究中提到 AI 的湧現,出現在「大模型」之上。大模型可以從運算量、訓練資料量或參數量而言。而該論文著墨在參數量。參數量意味著模型的複雜度與性能。
而下圖展現不同的大型語言模型,在不同任務上的表現。
Source: https://openreview.net/pdf?id=yzkSU5zdwD
每張圖 X 軸都是運算量的衡量單位,量級越大,對應的模型參數量也就越多。Y軸則是衡量模型表現的指標。這些任務涵蓋算數、國際音標轉換、拼字、外語Q&A 以及概念的映射/對應等等。
這裡面的模型不乏有像 GPT3 (ChatGPT的前身) 、或是Google的LaMDA,這種當今眾人都多少耳聞的模型。
不約而同地,模型的參數量在達到一個門檻,看起來是10的22至23次方的FLOPs,也就是100億到700億範圍的參數量,模型的表現會顯著飛升,機器的表現也會越加強大成熟。
反之,若未能突破此門檻,模型的表現大多在隨機水準中徘徊。這樣的機器,你可能不會覺得他是聰明可用,或甚至是有智能的。
GPT3.5,也就是ChatGPT目前的通用版本,參數是1750億,參數量已經超標了。這也是為何他能夠表現的這麼不凡的其中一個原因。

|來看看聰明的人工智慧,是如何表現的

聰明的人工智慧挺多的,有研究者實驗,他們給 ChatGPT 一串表情符號
**👧🐟🐠🐡
讓他猜一部電影。
你們猜的到嗎?我是滿頭問號啦,但 AI 可以準確猜中答案:「海底總動員」。我去試了一下,真的可以。奇怪,他明明連文字都沒有。
Bingo!!
李宏毅教授的課程也提到類似的現象 (以下連結影片42分52秒處開始)。該範例讓機器做文字轉語音,也就是讓機器發聲。輸入內容是「發財發財發財發財」,四次發財。
結果呢,唸四次發財,後面兩次的發財竟然出現了抑揚頓挫。照理來講不是應該用一樣的聲調,把發財唸完四次嗎?經測試,如果只發兩次發財,則不會有此現象。
至於為何會這樣呢?不知道。這種「我明明沒有教你啊,你怎麼會」的緊張感,就是湧現帶給我們的壓力。

|我們造的出湧現的 AI 模型嗎?

關於這個問題,答案是不太容易。
為了讓大家感受一下百億參數,我來講個人技術操作好了。
兩年多前我在防疫旅館隔離,閒來沒事就玩了一下神經網路 (Neural Network) 模型。下面簡略敘述一下技術名詞 (細節設定請看我有點混亂的Github程式碼)。當時,我使用了1995 ~ 1997年三年的 SP500 資料,其實沒有很多,784筆而已哦。訓練了一個設計非常樸素的模型 (一個隱藏層的雙向長短期記憶模型)。
這個模型──配上給定的訓練資料和參數設定,總共只有 13萬3377 個參數。
Source: https://github.com/DarrenTsungjenWu/Neural-Networks/blob/master/RNN-LSTM.ipynb
如果對於「參數」的技術有興趣,歡迎到以下影片看解說 (47分30秒左右開始),這是我們的 AI 社團 (歡迎加入!!) 的講座,講者是藍星球資訊科技的宋浩總經理──從2023年三月中起我們每週都請業界賢達演講。
工商結束。
再補充個事件吧,前陣子Facebook (Meta) 公司的大語言模型 Llama 外流,也引起許多討論。我直覺疑問是,誰跑得動那個模型呢?不論你是要直接拿來用或是要做維護,跑得起模型是最基本的。
Llama 也同 ChatGPT,是一個巨無霸模型,其複雜規模外加訓練所用的資料量,誰能否跑得動都很成問題。
這也反映一個現實,就是我們基本上是沒有能力,創建一個自己的大型語言模型的。這是運算能力的問題、這是軟體硬體的問題,這也是錢的問題。
在大機構面前,我們多無能為力呢?具體一點,有一次和主管同事去吃飯,閒聊到語言模型的話題。
當時有人說,Google 在 2018 年做出來的 BERT 模型,這是一個沒有ChatGPT那麼大那麼通用的模型,全世界能跑得動那個模型並且重現 Google 結果的,也不到 10 家組織或機構。
差距就在那,東西都送給你,你也不一定玩得起來。

|造物者的奇妙設計:湧現

湧現不只在 AI 的參數量,湧現也不只是AI 給我們的困惑與恐懼。湧現在世界各地也很普遍。開場提到的論文,引述了諾貝爾物理學獎得主 Anderson 的話:
Emergence is when quantitative changes in a system result in qualitative changes in behavior
就是我中國的朋友們很愛說的一句話:「量變產生質變」。
也就是一個系統中的數量單位達到一定的量,他就會產生一種全新的行為和能力。這些單位也許個別相當簡單、功能不多,但是經由互相的影響,一種全新的狀態就產生了。
這種現象出現在很多地方。
像是以個體來說,每個人都有自己的情感跟想法;但在聚集之中就產生了社會的規範和文化。
在金融上,我6年前寫了金融海嘯的系列文 (首篇) 也談到一個負面的湧現:經年累月的個別系統問題,帶來整個金融的崩壞。
像是證券化──把所有貸款變成許多全新可交易的產品,再來是亂給信用評等導致大家混亂的信用評價機構;最後是狂印鈔票的聯準會。
這三個各自為政的元素,經年累月下來就湊成了一個完美風暴。沒有人希望事情變糟,每個人都按照古典經濟學中理性自利的方向前進,最終卻造成了沒有人可以預測的打擊。
沒錯,不可預測或是難以解釋,就是湧現的力量。
湧現不是元素疊加而成,而是交互 (correlate)。因此很難從單一個元素或層面,就了解湧現這種整個系統的變化。
這篇寫到這好像也有點長了,下次有機會來聊聊以 AI 為例怎麼分析/理解湧現。還有在湧現力量驅使下的AI世界,我們會/應當如何。這題應該很好玩,哈。
avatar-img
14會員
14內容數
大數據意味著什麼?數據科學背後有怎樣的mind set和技術?數據科學家又做些什麼?這些科技/技術,帶給我們什麼生活上和人文上的省思?這個專題會橫跨這些彼此相關的面向,避開生澀的專業詞彙,探索這些事情背後的樣貌。應該會是有趣的知識和想法分享﹝笑﹞
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Darren的沙龍 的其他內容
這篇來寫,嘗試用GPT4解決工作中,一個讓我渾身難受的問題。 任務說明 我要做的事情是,把word檔中表格的部分資訊擷取出來。下圖的示範表格即是一例。 我需要存取表格中特定元素資訊,例如 Net Calorific Value,我得存下Min. 4,750這個訊息,同理可知,Total Sulfur
在英國與老師對嗆?! 先說個故事吧,以前在英國讀書的時候,去選修了一堂數學系的課。 那位老師嚴格要求,選修的學生必須是數學系的學生。如果不是,那學生必須說明自己擁有夠強的數學能力。 我不是數學系的學生,可我終究是吃硬柿子的人。因為我知道,若想加強數學的底子,就必須到這裡來──後來還是去上課了。 上了
這篇文放草稿太久了,放到連GPT4都生出來了。不過沒差,內容通用。 在系列文第一篇,就提到了GPT框架中有對人類語意回饋的學習機制。這機制有個專有名詞,叫強化學習 (Reinforcement Learning)。這讓機器不純粹依著既有資料模式,優化並生成預測;反而讓機器有更強的能力,去因應不同環境
現在這個充滿GPT開箱的年代,做什麼實測都感覺落伍。不過我覺得本文這兩個實測,即便不是最新穎,也算是方便好用且有益於生產力。 工作中,對我來說最困難的事情,就是快速量產。這裡寫兩個使用ChatGPT的案例,一個是寫作,一個是寫程式。後者是我的工作,我讓GPT融入我日常工作。 而下面二個實例,純展示結
ChatGPT剛推出時,我們辦公室討論紛紛,我馬上去玩了一下。當時心態很惡搞,詢問GPT什麼是蜥蜴人、女王是不是蜥蜴人 ﹝註:蜥蜴人是在都市傳說中常被提到的外星生物﹞。他的回答都說蜥蜴人只是一種虛構生物。好吧,我想這大抵符合人類的認知! 隔了幾天,我又去問GPT,什麼是蜥蜴人,他竟然告訴我,他不知道
這篇來寫,嘗試用GPT4解決工作中,一個讓我渾身難受的問題。 任務說明 我要做的事情是,把word檔中表格的部分資訊擷取出來。下圖的示範表格即是一例。 我需要存取表格中特定元素資訊,例如 Net Calorific Value,我得存下Min. 4,750這個訊息,同理可知,Total Sulfur
在英國與老師對嗆?! 先說個故事吧,以前在英國讀書的時候,去選修了一堂數學系的課。 那位老師嚴格要求,選修的學生必須是數學系的學生。如果不是,那學生必須說明自己擁有夠強的數學能力。 我不是數學系的學生,可我終究是吃硬柿子的人。因為我知道,若想加強數學的底子,就必須到這裡來──後來還是去上課了。 上了
這篇文放草稿太久了,放到連GPT4都生出來了。不過沒差,內容通用。 在系列文第一篇,就提到了GPT框架中有對人類語意回饋的學習機制。這機制有個專有名詞,叫強化學習 (Reinforcement Learning)。這讓機器不純粹依著既有資料模式,優化並生成預測;反而讓機器有更強的能力,去因應不同環境
現在這個充滿GPT開箱的年代,做什麼實測都感覺落伍。不過我覺得本文這兩個實測,即便不是最新穎,也算是方便好用且有益於生產力。 工作中,對我來說最困難的事情,就是快速量產。這裡寫兩個使用ChatGPT的案例,一個是寫作,一個是寫程式。後者是我的工作,我讓GPT融入我日常工作。 而下面二個實例,純展示結
ChatGPT剛推出時,我們辦公室討論紛紛,我馬上去玩了一下。當時心態很惡搞,詢問GPT什麼是蜥蜴人、女王是不是蜥蜴人 ﹝註:蜥蜴人是在都市傳說中常被提到的外星生物﹞。他的回答都說蜥蜴人只是一種虛構生物。好吧,我想這大抵符合人類的認知! 隔了幾天,我又去問GPT,什麼是蜥蜴人,他竟然告訴我,他不知道
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.
Thumbnail
AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
大語言模型是一種特殊的神經網路,設計來理解,生成與回應人類的文本。 大語言模型是使用大量文本數據訓練的深度神經網路,其訓練使用的文本數據甚至包括了整個網路公開的文本。 大語言模型的「大」,體現於模型的參數個數以及其使用的訓練數據集。如此大的模型可以有百億甚至千億的參數。這些參數都是神經網
30年後來看現在,或許會覺得,還好現在有AI,才讓人類進入真正的文明世紀。 GPT只是大型語言模型(LLM)的一種,大型語言模型只是人工智慧(AI)的一種,而人工智慧甚至可以說只是「量子技術」的一種。 AI除了用來聊天(就像一開始我們只是把電腦當打字機),最重要的功能是幫助我們更容易理解和運用量
Thumbnail
前言 在AI經歷數個冰河期後,終於在後疫情時代來到了一個技術高峰,而這個破冰者就是OPen AI(ChatGPT),對於這個話題不管你是是正在接觸AI,對AI技術有些了解的人,抑或是專業領域上對於AI介入感到焦慮的人都希望可以文中得到收穫。 本文想分享一些個人對於AI的理解及對於LLM模型的一些
Thumbnail
生成式 AI 讓人們驚艷,也開始認真思考:生成式 AI 會對教育培訓帶來什麼樣的衝擊?AI 會取代老師嗎?如何運用生成式 AI 來加速學習?企業如何運用生成式 AI 來加速創新? 但也開始懷疑 — 人類的工作是不是真的要被 AI 取代了?.....
Thumbnail
生成式人工智慧(AI)已成為當前科技領域的一大熱點,其能力不僅限於模擬人類智能,更能在多種非傳統計算任務中創造前所未有的內容。這篇文章將深入探討生成式AI的理論基礎、實際應用、代碼實踐,以及其商業應用、工具和公司等方面,提供一個全面的視角來了解這一迅速發展的領域。
Thumbnail
在人工智慧(AI)領域中,生成式AI已經成為一個備受關注的分支,它不僅在創造性的工作中展現出強大的能力,還在各個領域中展現出潛在的應用價值。本文將從宏觀的角度出發,深入探討生成式AI的種類、概念、缺點、公司、訓練、發展趨勢以及原理,帶領讀者深入了解這個令人振奮的領域。
Thumbnail
大語言模型(LLMs)對於任何對人工智能和自然語言處理感興趣的人來說都是一個令人興奮的領域。 這類模型,如GPT-4, 透過其龐大的數據集和複雜的參數設置, 提供了前所未有的語言理解和生成能力。 那麼,究竟是什麼讓這些模型「大」得如此不同呢?
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.
Thumbnail
AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
大語言模型是一種特殊的神經網路,設計來理解,生成與回應人類的文本。 大語言模型是使用大量文本數據訓練的深度神經網路,其訓練使用的文本數據甚至包括了整個網路公開的文本。 大語言模型的「大」,體現於模型的參數個數以及其使用的訓練數據集。如此大的模型可以有百億甚至千億的參數。這些參數都是神經網
30年後來看現在,或許會覺得,還好現在有AI,才讓人類進入真正的文明世紀。 GPT只是大型語言模型(LLM)的一種,大型語言模型只是人工智慧(AI)的一種,而人工智慧甚至可以說只是「量子技術」的一種。 AI除了用來聊天(就像一開始我們只是把電腦當打字機),最重要的功能是幫助我們更容易理解和運用量
Thumbnail
前言 在AI經歷數個冰河期後,終於在後疫情時代來到了一個技術高峰,而這個破冰者就是OPen AI(ChatGPT),對於這個話題不管你是是正在接觸AI,對AI技術有些了解的人,抑或是專業領域上對於AI介入感到焦慮的人都希望可以文中得到收穫。 本文想分享一些個人對於AI的理解及對於LLM模型的一些
Thumbnail
生成式 AI 讓人們驚艷,也開始認真思考:生成式 AI 會對教育培訓帶來什麼樣的衝擊?AI 會取代老師嗎?如何運用生成式 AI 來加速學習?企業如何運用生成式 AI 來加速創新? 但也開始懷疑 — 人類的工作是不是真的要被 AI 取代了?.....
Thumbnail
生成式人工智慧(AI)已成為當前科技領域的一大熱點,其能力不僅限於模擬人類智能,更能在多種非傳統計算任務中創造前所未有的內容。這篇文章將深入探討生成式AI的理論基礎、實際應用、代碼實踐,以及其商業應用、工具和公司等方面,提供一個全面的視角來了解這一迅速發展的領域。
Thumbnail
在人工智慧(AI)領域中,生成式AI已經成為一個備受關注的分支,它不僅在創造性的工作中展現出強大的能力,還在各個領域中展現出潛在的應用價值。本文將從宏觀的角度出發,深入探討生成式AI的種類、概念、缺點、公司、訓練、發展趨勢以及原理,帶領讀者深入了解這個令人振奮的領域。
Thumbnail
大語言模型(LLMs)對於任何對人工智能和自然語言處理感興趣的人來說都是一個令人興奮的領域。 這類模型,如GPT-4, 透過其龐大的數據集和複雜的參數設置, 提供了前所未有的語言理解和生成能力。 那麼,究竟是什麼讓這些模型「大」得如此不同呢?