ChatGPT 是什麼? ChatGPT 的原理

更新於 發佈於 閱讀時間約 6 分鐘

說明:

這文章其實也是李宏毅老師 2023 年機器學習課程的個人一些學習整理,李老師上課的內容&口吻很精彩,很建議大家直接看李老師的課程影片: 完整的所有課程在這裏


ChatGPT 是什麼

ChatGPT 是一個 底層使用 GPT 技術的(文字接龍)對話機器人,它可以讓你使用你熟悉的自然語言來與它互動,例如,你可以直接請它來幫你規劃你的課程大綱。

raw-image

它甚至可以知道和你對話的前後文來與你對話。

raw-image

ChatGPT 不是什麼

因為這麽神奇的功能,所以最近各路人馬都對它有各種的想像,例如,它這麽會回答問題,是不是被裝了很多的罐頭文?

不過其實不是! 你實際要它說幾個笑話給你,你會發現有很多的笑話的笑點根本不是正常人的笑點。

raw-image

又,這樣 ChatGPT 回答你的,是不是網路上搜尋後的回覆?

也不是! ChatGPT的答案不是從網路上搜尋而來的,它其實是一個經過使用大量網路語料訓練後的大型語言模型。

ChatGPT 的原理

基本上 ChatGPT就是一個大型的語言模型,而它做的事情其實就是文字接龍。

raw-image

文字接龍是什麼意思?

例如,你詢問它【什麼是機器學習?】它就會透過它的語言模型來判斷接下來的字有哪些,以及每個字的正確機率是多少,然後再經過某種判斷機制選擇最有可能的字來回覆你。

ChatGPT 的關鍵技術

ChatGPT 裏面的 GPT 就是 Generative Pre-trained Transformer 的縮寫。

而 ChatGPT 的關鍵技術,Pre-trained,又叫做自監督式學習(Self-supervised Learning),也因為對於一般大眾比較好理解,所以也常被稱為基石模型(Foundation Model)

raw-image

那 ChatGPT 那文字接龍的能力是怎麼被訓練出來的呢?

ChatGPT 成體的運作機制,簡單來說,我們可以將它想像成一個就像數學函數的大黑盒。當使用者跟 ChatGPT 對話時,就像我們把對話內容輸入給這個黑盒,這黑盒子就挑選最有可能的字,然後一一(吐出)回覆。

而這個神奇的函數,則是由大量的網路資料以及人類指導老師來訓練並且調教出來的。

raw-image

所謂的由大量的網路資料來訓練是什麼意思呢?我們使用傳統英翻中的機器學習為例:

傳統的機器學習需要蒐集大量成對的中英文成對例句來餵給機器,讓機器自己尋找那個可能的函式,當機器透過這樣的學習後,例如它已經學會了:

I = 我, You = 你, apple = 蘋果, orange = 橘子

然後我們將【You eat an apple】輸入到機器,機器則會回覆【你吃蘋果】給我們

raw-image

但是使用這種方式,需要準備大量的資料,所以在人力有限的狀況下,我們用這種方式來窮舉所有人們可能詢問的問題簡直是不可能的。

所以就有了自督導式學習(Self-supervised Learning)這種方式來幫我們無痛製造成對資料。

使用自督導式學習,網路上的每一段文字都可以自動化來拆解成前後兩段文字來訓練機器做文字接龍,例如

世界第一高峰是喜馬拉雅山,可拆解為【世界第一高峰是】【喜馬拉雅山】
今天天氣真好,我要出去玩,可拆解為【今天天氣真好】【,我要出去玩】

上面第二句的拆解不是筆誤,常常使用 ChatGPT 的朋友有時會發現它的回答為什麼開頭第一個字是逗點?

其實就是因為這樣預訓練的原因。
raw-image

大型語言模型

而這樣的訓練方式要訓練成 ChatGPT 到底需要多少資料呢? 其實在 ChatGPT 之前,GTP 已經有很多代的演進。從2018年的第一代 GPT,模型參數數量為117M 個,資料量只有 1GB。GPT-2 的1542M 個模型參數到 GPT-3 的 175B 個模型參數, 570GB 的資料量,這差異性到底是有多大? 我們直接按照比例放大給大家看:

這是 GPT VS GPT-2,GTP-2 與 GTP 相比,模型參數量與資料量夠大吧!?

raw-image

GTP-2 VS GTP-3 的比例更驚人! GTP-3 訓練的資料量換算成哈利波特全集的話,大概是閱讀哈利波特全集 30 萬遍這麽多。

raw-image

而且 GTP-3 這 570GB 資料量,還是所有 45T 的網絡資料優化篩選出來的,最精華的 570GB。

然而,GPT 在經過這麽大量資料以及這麽多參數的學習後,它在問答功能上的成效如何呢?

raw-image

上圖是 GTP-2 模型與其他模型/人類的比較,縱軸上的 F1 大家可以簡單把它看作正確率。

從這圖表可以看出,GTP-2 與一些其他模型比較,的確還不錯,可以證明只是簡單從網路上的資料訓練出來的語言模型,已經可以勝過例如 PGNet, DrQA 這類模型了。只是當然跟人類的正確率相比,GTP-2 的正確性還是很不堪入目。

那 GTP-3 呢?

raw-image

上圖是從 GTP-3 的論文截取出來的圖表, GTP-3 選擇出來 42 類問題來做問答正確率的分析圖表,橫軸上代表的參數數量,可以看出來,參數量越大,模型的正確性的確越高,但是大家可以看出即使連 GTP-3 這麽大的模型,似乎它的正確性也比亂猜(50%)好一點而已。所以當初甚至也有一些人看衰大型語言模型,它即使使用了這麽大的運算資源做訓練,好像也是白做工。

不過也多虧有人不灰心繼續進化,所以最後也才有了,最近驚呆了全世界的 ChatGTP(GTP 3.5)的出現,至於 ChatGTP 的訓練還有什麼其他的關鍵技術?

我們下回再跟大家介紹~


我們這篇文章內的圖表都是由李宏毅老師的課程投影片中選錄截取出來的,原始投影片可參考李老師課程首頁內連接: Machine Learning 2023 Spring

很感謝李宏毅老師無私的分享以及同意使用。

留言
avatar-img
留言分享你的想法!
阿Han-avatar-img
2023/05/28
謝謝分享, 知識含金量豐富
Ted Chen-avatar-img
發文者
2023/05/29
阿Han 很高興對你有所啓發,我也是正在邊學習邊整理思緒中。
avatar-img
Ted Chen的沙龍
18會員
19內容數
Ted Chen的沙龍的其他內容
2023/08/04
本篇文章深入探討了如何評估模糊訊息在對話系統開發中的它的品質驗證方式,並且使用了類似Rubic評分準則的方法來評估回覆訊息。也介紹了專家回覆與實際回覆比較的評估方式。文章最終目的希望能讓讀者具備開發自己的對話機器人的知識。
Thumbnail
2023/08/04
本篇文章深入探討了如何評估模糊訊息在對話系統開發中的它的品質驗證方式,並且使用了類似Rubic評分準則的方法來評估回覆訊息。也介紹了專家回覆與實際回覆比較的評估方式。文章最終目的希望能讓讀者具備開發自己的對話機器人的知識。
Thumbnail
2023/07/28
此文針對對話系統的持續開發和改進過程進行詳細解說,尤其在提示訊息的設計與驗證方面。以大賣場的銷售助理為例,我們設計了提示訊息,進行多次測試與調整,確保回應結果符合預期。透過建立測試集和評估函式,我們實現了批次驗證,確保所有測試項目的有效性。
Thumbnail
2023/07/28
此文針對對話系統的持續開發和改進過程進行詳細解說,尤其在提示訊息的設計與驗證方面。以大賣場的銷售助理為例,我們設計了提示訊息,進行多次測試與調整,確保回應結果符合預期。透過建立測試集和評估函式,我們實現了批次驗證,確保所有測試項目的有效性。
Thumbnail
2023/07/21
本篇文章探討如何整合大型語言模型與外部程式與資源來生成回應訊息。我們使用OpenAI的Moderation API來確認內容的合適性,並使用新的提示來評估是否真正解答了使用者的疑問。整體流程的匯整讓我們一覽全貌。我們將在下一篇文章中分享更多有關回應訊息評估的細節。
Thumbnail
2023/07/21
本篇文章探討如何整合大型語言模型與外部程式與資源來生成回應訊息。我們使用OpenAI的Moderation API來確認內容的合適性,並使用新的提示來評估是否真正解答了使用者的疑問。整體流程的匯整讓我們一覽全貌。我們將在下一篇文章中分享更多有關回應訊息評估的細節。
Thumbnail
看更多
你可能也想看
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
基本介紹及主要的功能。 淺層基礎原理解釋。 優缺點及問題分析。 ChatGPT,這個名字在過去幾個月內迅速成為科技界的一個熱門話題。它是由OpenAI發布的一款聊天機器人,自從去年11月推出以來,它以驚人的速度突破了1億的訪問量,不僅成為了成長速度最快的消費者應用程式,更在各種專業和學術
Thumbnail
基本介紹及主要的功能。 淺層基礎原理解釋。 優缺點及問題分析。 ChatGPT,這個名字在過去幾個月內迅速成為科技界的一個熱門話題。它是由OpenAI發布的一款聊天機器人,自從去年11月推出以來,它以驚人的速度突破了1億的訪問量,不僅成為了成長速度最快的消費者應用程式,更在各種專業和學術
Thumbnail
歡迎您踏入ChatGPT的世界!這份全面的指南將帶領您探索如何創造出清晰且有效的ChatGPT提示,以激發出引人入勝且充滿資訊的對話。 從學習有效提示的基本原則,到掌握如何建立清晰且簡潔提示的技巧,本專題將提供您所需的知識與技能,讓您的ChatGPT對話能達到新的高度。
Thumbnail
歡迎您踏入ChatGPT的世界!這份全面的指南將帶領您探索如何創造出清晰且有效的ChatGPT提示,以激發出引人入勝且充滿資訊的對話。 從學習有效提示的基本原則,到掌握如何建立清晰且簡潔提示的技巧,本專題將提供您所需的知識與技能,讓您的ChatGPT對話能達到新的高度。
Thumbnail
ChatGPT 是由 OpenAI 開發的一種人工智能語言模型,它基於 GPT-3.5 架構。GPT 的全名是 "Generative Pre-trained Transformer",它是一種預訓練的自然語言處理模型。GPT-3.5 是 GPT 系列的最新版本,它在 GPT-3 的基礎上進行了改進
Thumbnail
ChatGPT 是由 OpenAI 開發的一種人工智能語言模型,它基於 GPT-3.5 架構。GPT 的全名是 "Generative Pre-trained Transformer",它是一種預訓練的自然語言處理模型。GPT-3.5 是 GPT 系列的最新版本,它在 GPT-3 的基礎上進行了改進
Thumbnail
這篇文章揭示了訓練GPT模型的三個核心技術:預訓練、微調及增強式學習。預訓練利用大量網路資料提供基礎能力;微調讓GPT更貼近人類思維偏好;增強式學習最終優化模型回答問題的方式。此外,多語言預訓練能讓GPT在一語言的任務學習後,自動掌握其他語言的同樣任務。
Thumbnail
這篇文章揭示了訓練GPT模型的三個核心技術:預訓練、微調及增強式學習。預訓練利用大量網路資料提供基礎能力;微調讓GPT更貼近人類思維偏好;增強式學習最終優化模型回答問題的方式。此外,多語言預訓練能讓GPT在一語言的任務學習後,自動掌握其他語言的同樣任務。
Thumbnail
這篇文章介紹了ChatGPT,一種大型的語言模型,能以自然語言回答問題,但不透過搜尋罐頭文字或網路內容。其核心技術是自監督式學習,通過大量的網路資料進行訓練,讓模型能進行文字接龍。儘管GPT系列經歷了多次演進,並需用大量的訓練資料,它的問答能力仍有待提升。然而,透過不斷優化,我們已有了更進一步的版本
Thumbnail
這篇文章介紹了ChatGPT,一種大型的語言模型,能以自然語言回答問題,但不透過搜尋罐頭文字或網路內容。其核心技術是自監督式學習,通過大量的網路資料進行訓練,讓模型能進行文字接龍。儘管GPT系列經歷了多次演進,並需用大量的訓練資料,它的問答能力仍有待提升。然而,透過不斷優化,我們已有了更進一步的版本
Thumbnail
[進行中未完成] 1.簡介 本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統 (如GPT-3、GPT-4、Bing Chat、Bard等)有一些了解。 ChatGPT是一種聊天機器人,是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生,但此文將一一解釋這些概念。
Thumbnail
[進行中未完成] 1.簡介 本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統 (如GPT-3、GPT-4、Bing Chat、Bard等)有一些了解。 ChatGPT是一種聊天機器人,是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生,但此文將一一解釋這些概念。
Thumbnail
在正式以比較技術面角度來認識 ChatGPT / GPT 之前,我們先用幾個簡單的例子來認識 ChatGPT 以及語言模型可以做到怎樣的事情。 什麼是 ChatGPT? 簡單來說明,ChatGPT 是一個背後使用 GPT 語言模型的對話機器人,而它可以做什麼事情了?我們先來使用幾個常見的語言相關的任
Thumbnail
在正式以比較技術面角度來認識 ChatGPT / GPT 之前,我們先用幾個簡單的例子來認識 ChatGPT 以及語言模型可以做到怎樣的事情。 什麼是 ChatGPT? 簡單來說明,ChatGPT 是一個背後使用 GPT 語言模型的對話機器人,而它可以做什麼事情了?我們先來使用幾個常見的語言相關的任
Thumbnail
ChatGPT 是一款基於 GPT 技術的自然語言處理工具。那 GPT 是什麼呢?GPT 指的是 Generative Pre-trained Transformer,它是一種神經網絡模型,能夠處理自然語言的文本數據,學習文本之間的關聯,並且能夠根據這些關聯自動生成新的文本。ChatGPT 正是利用
Thumbnail
ChatGPT 是一款基於 GPT 技術的自然語言處理工具。那 GPT 是什麼呢?GPT 指的是 Generative Pre-trained Transformer,它是一種神經網絡模型,能夠處理自然語言的文本數據,學習文本之間的關聯,並且能夠根據這些關聯自動生成新的文本。ChatGPT 正是利用
Thumbnail
我使用 ChatGPT 已經超過 1 個月了,極度關注 ChatGPT 的相關新聞。我發現網路與報章雜誌上都開始報導 ChatGPT 這款工具,但多數人還是不瞭解這款工具可以如何幫助我們。如果不了解 ChatGPT 的細節,我們就只能「聽說」這款工具很厲害,但卻無法為己所用。這篇文章分享 3 個快速
Thumbnail
我使用 ChatGPT 已經超過 1 個月了,極度關注 ChatGPT 的相關新聞。我發現網路與報章雜誌上都開始報導 ChatGPT 這款工具,但多數人還是不瞭解這款工具可以如何幫助我們。如果不了解 ChatGPT 的細節,我們就只能「聽說」這款工具很厲害,但卻無法為己所用。這篇文章分享 3 個快速
Thumbnail
相信這個大家最近都有看到新聞,就是OepnAI這個基金會提出了一個新的AI模型ChatGPT,這個ChatGPT跟以往的AI模型不太一樣,基本上輸入很多問題都可以獲得解答,而且回答得語氣跟人類很像。 同時這個ChatGPT很厲害的事情,包含可以產出程式、幫助回覆程式問題、產出行銷文案、演講大綱等等,
Thumbnail
相信這個大家最近都有看到新聞,就是OepnAI這個基金會提出了一個新的AI模型ChatGPT,這個ChatGPT跟以往的AI模型不太一樣,基本上輸入很多問題都可以獲得解答,而且回答得語氣跟人類很像。 同時這個ChatGPT很厲害的事情,包含可以產出程式、幫助回覆程式問題、產出行銷文案、演講大綱等等,
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News