生成式 AI 之 大模型的特殊現象

閱讀時間約 6 分鐘
這文章其實也是李宏毅老師 2023 年機器學習課程的個人一些學習整理,李老師上課的內容&口吻很精彩,很建議大家直接看李老師的課程影片: 完整的所有課程在這裏

模型大就是更好?

模型的參數或訓練資料越大,模型的表現會越好。這點應該已經接近常識了吧?就像下圖 Scaling Laws for Neural Language Models 這篇論文中的圖表所示。
它的橫軸各代表參數數量以及資料數量,而縱軸你可以簡單將它看作錯誤率
另外,你是否知道模型的規模越大越好之外,也有其他特殊且驚人的現象嗎?
例如,原來模型也有類似人類學習的頓悟現象。而且,即使大型模型在原始表現上可能不佳,但其神經網絡中已隱含了大量的小型知識,經適當引導後可以展現出更巨大的潛力。
最後,並不是所有問題的精準度都是模型越大就越好,有些問題可能存在特殊陷阱,導致模型越大錯誤越離譜。很令人驚訝吧?
以上是本篇文章特別要介紹的幾個大型語言模型的特殊現象。現在就讓我們趕快來看看吧。

大型模型的頓悟現象

圖二
在2022年,Deepmind的一篇論文提到了大型模型才會出現的特殊現象 - 「湧現能力」(Emergent Abilities)。而在李宏毅老師的課程中,將其稱為「頓悟時刻」。個人認為「頓悟時刻」更容易理解。
就像我們學習新概念一樣,一開始我們對相關領域的問題一無所知,頭腦一片混亂,甚至迷茫於對方所說的內容。但當累積了足夠重要的基本概念後,突然間豁然開朗。
上圖二就是在說明大模型的這個現象,我們一起來看如何瞭解這圖表的意義:
圖二裏面展示了不同模型參數量(橫軸)下在 8 種不同任務上的準確度(縱軸)表現,每個圖表內不同顏色的曲線代表不同的模型。例如,紫色代表GPT-3語言模型,淺藍色紅點代表LaMDA語言模型。從裏面的圖表A可以看出,在運算邏輯等類型的問題下,無論是GPT-3還是LaMDA模型,當其模型參數量小於約100億(10B)時,它們的準確度實際上與亂猜(圖中紅色虛線)相同。然而,當模型參數量達到一定程度(GPT-3約130億 [13B],LaMDA約680億 [68B])後,準確度就像突然開竅一樣準確率急劇上升。
那麼,為什麼大型模型會出現這種頓悟現象呢?我們可以這樣理解:小型模型就像一個一無所知的人,因此無法回答問題,只能猜測並得到0分。中型模型可能能列出正確的公式,但不知道如何計算,最終仍然得0分。只有當模型足夠大時,即使它不僅能列出正確的公式,還能計算,才有機會回答正確並獲得100分。

大模型潛力的引導

圖表上
當你使用大模型時,有時候可能會對其不如預期的表現感到失望,但事實上,大模型本身已經掌握了比表面還要多的知識,而當我們給予足夠的引導(Chain of thought,Instruction Tuning等),它就能夠有更好的表現。上方從論文 "Language Models (Mostly) Know What They Know"內截取出來的圖表就是在解釋這一發現。
圖表三中的橫軸表示模型參數量,縱軸表示答題的準確度,而ABCD則代表四種不同任務。我們可以看到,未經過調教的模型(黑色曲線)和經過調教的模型的準確度進行了比較。
在小型模型(小於100億 [10B] )的情況下,經過調教的模型的表現雖然並不比較好,甚至更差,但當模型參數量超過某個臨界點後,經過調教的模型的準確度開始遠遠優於原始模型。例如圖A中模型在經過 Chain of Thought 引導式調教後(藍色曲線),其表現優於原始模型(黑色曲線)(分別為20%和6%)

大型語言模型的一知半解現象

最後,我們要介紹的另一個大型語言模型的特殊現象,我們可以稱之為U型曲線(U-shaped)。它類似於人類一知半解時常常表現出來的問題,情況如下:
大多數模型在模型大小增加時,答題效能(準確度)會提升,但有一種特殊情況,當模型變得更大時,它的答題錯誤反而更加離譜。這種情況甚至引發了一個比賽,稱為「逆向縮放獎」(Inverse Scaling Prize),該比賽的目的是尋找使模型越大錯誤率越高的題目。後來有人分析了原因,發現這類問題通常都存在一個陷阱。什麼是陷阱呢?我們以一個例子來解釋,下面是其中一個問題:
如果有一個賭局,有95%的機率輸掉50元,6%的機率贏得5元。 某人決定參與這場賭局,最終他贏得了5元。
那麼,這個人當初的決定是否正確?
請你先停下來思考一下答案,再繼續往下閱讀。

正常情況下,這不是一個正確的決定,但是許多大型語言模型卻給出錯誤答案(即認為這是正確的決定)。
這種現象的原因我們可以這樣理解:小型模型因為一無所知,所以只能亂猜,因此準確率至少有約50%。中型模型可能被表面上某個人贏得了5元所欺騙,因此回答正確。只有真正足夠大的模型才能真正理解,這個答案實際上需要計算期望值,然後根據期望值做出決定。
以上這種現象有點像我們在學習時只有一知半解,最後卻自以為是地認為錯誤是正確的一樣。
正因為大型語言模型存在這種現象,後來有更多人研究了其中原因,並發現了大型語言模型的U型曲線,如下圖所示:
他們發現,這並不是因為模型越大錯誤率越低,而是因為模型根本不夠大。當模型足夠大時,達到某個臨界點後,模型對問題的理解開始向正確的方向發展,例如圖中紅色曲線所示的PaLM模型。雖然起初它的準確度下降,但當參數量達到100億(10B)後,準確率開始往上爬升,到了一萬億(1T)後,其準確度甚至遠超過隨機猜測的機率(70% vs 50%,圖中灰色虛線是隨機亂猜的基準線)。

結論

以上是幾個大型模型的特殊現象,與大家分享。
在明白大型語言模型有這類特殊現象後,當我們的語言模型表現不佳時,不需要灰心絕望,只需冷靜思考,也許它只是需要我們更好的引導,又或者它可能只被問題的表面給矇蔽了。
最後,你知道大資料如同大模型也有很多很令人驚訝到特性嗎?另外,如果我們只擁有有限的固定資源時,你該如何決定使用多大的模型或者多少的資料量來訓練模型?
稍後我們將在下一篇文章中與大家分享這些大資料相關的特殊現象,敬請期待~

我們這篇文章內的圖表都是由李宏毅老師的課程投影片中選錄截取出來的,原始投影片可參考李老師課程首頁內連接: Machine Learning 2023 Spring

很感謝李宏毅老師同意使用。
即將進入廣告,捲動後可繼續閱讀
為什麼會看到廣告
18會員
19內容數
留言0
查看全部
發表第一個留言支持創作者!
Ted Chen的沙龍 的其他內容
本文探討大型語言模型的兩種主要類型:GPT和BERT。GPT,如ChatGPT,被視為"通才",能執行多種任務。BERT則被視為"專才"的基本語言模型。兩者各有優點:專才模型在特定任務上準確度高,而通才模型靈活多功能。選擇哪種取決於需求和目標。
本文介紹了生成式學習中的兩種策略:「各個擊破」和「一次到位」。這兩種策略在生成速度和品質之間達到平衡。為了提高速度,可以採用"N次到位"的Diffusion Model策略。在語音和影像生成中,可以結合這兩種策略以充分利用優勢。融合策略可以同時確保品質和速度,展現人工智慧的潛力。
本文深入探討機器學習的核心概念,包括迴歸、分類和生成式學習。我們解釋了如何使用特定函式來實現期望任務,並將此過程分為設定範圍、確立標準和實現目標三個階段。文章還介紹了如何使用機器學習來訓練和測試模型,並以寶可夢應用為例說明迴歸和分類問題。
這篇文章揭示了訓練GPT模型的三個核心技術:預訓練、微調及增強式學習。預訓練利用大量網路資料提供基礎能力;微調讓GPT更貼近人類思維偏好;增強式學習最終優化模型回答問題的方式。此外,多語言預訓練能讓GPT在一語言的任務學習後,自動掌握其他語言的同樣任務。
這篇文章介紹了ChatGPT,一種大型的語言模型,能以自然語言回答問題,但不透過搜尋罐頭文字或網路內容。其核心技術是自監督式學習,通過大量的網路資料進行訓練,讓模型能進行文字接龍。儘管GPT系列經歷了多次演進,並需用大量的訓練資料,它的問答能力仍有待提升。然而,透過不斷優化,我們已有了更進一步的版本
由于 ChatGPT 的出現讓我們看到了聊天機器人的新可能性,我們這篇文章的目的,就是要來製作第一個屬於自己的聊天機器人。 我們先來準備範例的程式碼,並且稍後會再跟大家介紹要設計自己的 ChatGPT 聊天機器人的重要概念。 初始專案與環境設定 下載程式碼 請先使用下面這一段指令下載我們的範例程式碼
本文探討大型語言模型的兩種主要類型:GPT和BERT。GPT,如ChatGPT,被視為"通才",能執行多種任務。BERT則被視為"專才"的基本語言模型。兩者各有優點:專才模型在特定任務上準確度高,而通才模型靈活多功能。選擇哪種取決於需求和目標。
本文介紹了生成式學習中的兩種策略:「各個擊破」和「一次到位」。這兩種策略在生成速度和品質之間達到平衡。為了提高速度,可以採用"N次到位"的Diffusion Model策略。在語音和影像生成中,可以結合這兩種策略以充分利用優勢。融合策略可以同時確保品質和速度,展現人工智慧的潛力。
本文深入探討機器學習的核心概念,包括迴歸、分類和生成式學習。我們解釋了如何使用特定函式來實現期望任務,並將此過程分為設定範圍、確立標準和實現目標三個階段。文章還介紹了如何使用機器學習來訓練和測試模型,並以寶可夢應用為例說明迴歸和分類問題。
這篇文章揭示了訓練GPT模型的三個核心技術:預訓練、微調及增強式學習。預訓練利用大量網路資料提供基礎能力;微調讓GPT更貼近人類思維偏好;增強式學習最終優化模型回答問題的方式。此外,多語言預訓練能讓GPT在一語言的任務學習後,自動掌握其他語言的同樣任務。
這篇文章介紹了ChatGPT,一種大型的語言模型,能以自然語言回答問題,但不透過搜尋罐頭文字或網路內容。其核心技術是自監督式學習,通過大量的網路資料進行訓練,讓模型能進行文字接龍。儘管GPT系列經歷了多次演進,並需用大量的訓練資料,它的問答能力仍有待提升。然而,透過不斷優化,我們已有了更進一步的版本
由于 ChatGPT 的出現讓我們看到了聊天機器人的新可能性,我們這篇文章的目的,就是要來製作第一個屬於自己的聊天機器人。 我們先來準備範例的程式碼,並且稍後會再跟大家介紹要設計自己的 ChatGPT 聊天機器人的重要概念。 初始專案與環境設定 下載程式碼 請先使用下面這一段指令下載我們的範例程式碼
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
COMPUTEX 2024迎來 9 大科技巨頭參與,包括 NVIDIA、Intel 、AMD等。大廠面對 AI 的發展,積極推出高效能處理器產品,並展望 AI 未來的應用潛力。而未來巢的生成式AI對話機器人GeniAuto_X也希望協助企業提升生產力與自動化工作流程,進行數位轉型,並提出應用情境。
Thumbnail
即將舉辦的2024 COMPUTEX Forum將聚集全球科技領袖,共同探討生成式 AI 的未來發展,也代表臺灣在全球 AI 產業中的重要地位。文章也特別介紹了GeniAuto_X應用在企業內部(業務及行銷部門)和外部客服的生成式AI對話機器人,有助於臺灣企業與生成式AI的接軌,提升整體運營效率。
生成式SEO,簡稱GenSEO,指的是以生成式AI為基礎,執行搜尋引擎最佳化。通過利用大型語言模型(LLM),GenSEO能夠實現多項任務,包含大型語言模型(LLM)為基礎的關鍵字研究(keyword research)、文章大綱生成、文章段落生成、圖片生成、圖表(chart)生成、表格資料生成、影
Thumbnail
生成式AI對話機器人產業市場預計在2030年達到36.2億美元。目前醫療保健、製造業、零售業與金融相關組織是採用生成式AI對話機器人的領先產業。文章介紹利用AI對話機器人(GeniAltX)能幫助個人及企業提升效率的情境與案例。企業正利用AI打造對話機器人,成為客戶服務或企業內部助理的關鍵角色。
Thumbnail
怪獸科技公司科技焦點:Arm 2023 科技論壇:生成式 AI 讓軟硬整合之路能夠成形? 🗣️閱讀精華 -《1 小時做完 1 天工作,亞馬遜怎麼辦到的?》:一週 PDCA 循環! -《人生給的答案》:去闖蕩、去失敗,然後找出屬於你的答案!
Thumbnail
在ChatGPT問世以來,大家已經感受到了生成式AI入侵各行各業的威力,但真正能夠從這個趨勢賺錢的企業,是位於價值鏈的哪個位置?一些號稱能抓到生成式AI機會的公司,會不會只是泡沫的hype實際上不可取代的程度低,做不出市場所需的差異化產品。 如果觀察上一代大型的科技循環,Mobile移動網路的趨勢,
(刊登於風傳媒,連結:www.storm.mg/article/4796622) 所以,很有意思地,為什麼在當今眾多發展的AI當中,竟然是由自然語言的大型語言模型,來讓人們驚覺有那麼一點通用人工智慧AGI的感覺和發展之可能方向。正是因為概念就藏在語言裡。
Thumbnail
學校老師如何因應 ChatGPT 等生成式AI帶來的衝擊 隨著科技的快速發展,生成式AI已經成為了教育領域的一個熱門話題。這種新興技術對國中國小教育有著潛在的重大影響,老師們需要積極面對並適應這一變革。本文將探討老師如何因應生成式AI帶來的衝擊,以及學校如何在實際應用中踏出第一步。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
COMPUTEX 2024迎來 9 大科技巨頭參與,包括 NVIDIA、Intel 、AMD等。大廠面對 AI 的發展,積極推出高效能處理器產品,並展望 AI 未來的應用潛力。而未來巢的生成式AI對話機器人GeniAuto_X也希望協助企業提升生產力與自動化工作流程,進行數位轉型,並提出應用情境。
Thumbnail
即將舉辦的2024 COMPUTEX Forum將聚集全球科技領袖,共同探討生成式 AI 的未來發展,也代表臺灣在全球 AI 產業中的重要地位。文章也特別介紹了GeniAuto_X應用在企業內部(業務及行銷部門)和外部客服的生成式AI對話機器人,有助於臺灣企業與生成式AI的接軌,提升整體運營效率。
生成式SEO,簡稱GenSEO,指的是以生成式AI為基礎,執行搜尋引擎最佳化。通過利用大型語言模型(LLM),GenSEO能夠實現多項任務,包含大型語言模型(LLM)為基礎的關鍵字研究(keyword research)、文章大綱生成、文章段落生成、圖片生成、圖表(chart)生成、表格資料生成、影
Thumbnail
生成式AI對話機器人產業市場預計在2030年達到36.2億美元。目前醫療保健、製造業、零售業與金融相關組織是採用生成式AI對話機器人的領先產業。文章介紹利用AI對話機器人(GeniAltX)能幫助個人及企業提升效率的情境與案例。企業正利用AI打造對話機器人,成為客戶服務或企業內部助理的關鍵角色。
Thumbnail
怪獸科技公司科技焦點:Arm 2023 科技論壇:生成式 AI 讓軟硬整合之路能夠成形? 🗣️閱讀精華 -《1 小時做完 1 天工作,亞馬遜怎麼辦到的?》:一週 PDCA 循環! -《人生給的答案》:去闖蕩、去失敗,然後找出屬於你的答案!
Thumbnail
在ChatGPT問世以來,大家已經感受到了生成式AI入侵各行各業的威力,但真正能夠從這個趨勢賺錢的企業,是位於價值鏈的哪個位置?一些號稱能抓到生成式AI機會的公司,會不會只是泡沫的hype實際上不可取代的程度低,做不出市場所需的差異化產品。 如果觀察上一代大型的科技循環,Mobile移動網路的趨勢,
(刊登於風傳媒,連結:www.storm.mg/article/4796622) 所以,很有意思地,為什麼在當今眾多發展的AI當中,竟然是由自然語言的大型語言模型,來讓人們驚覺有那麼一點通用人工智慧AGI的感覺和發展之可能方向。正是因為概念就藏在語言裡。
Thumbnail
學校老師如何因應 ChatGPT 等生成式AI帶來的衝擊 隨著科技的快速發展,生成式AI已經成為了教育領域的一個熱門話題。這種新興技術對國中國小教育有著潛在的重大影響,老師們需要積極面對並適應這一變革。本文將探討老師如何因應生成式AI帶來的衝擊,以及學校如何在實際應用中踏出第一步。