拐點 #003: GPT 的名稱怎麼來的

Item: 拐點
Rating: 5
Author: Will Shen

Will Shen

發佈於拐點

2024/05/20 更新2024/05/12 發佈閱讀 6 分鐘

在機器學習領域中，監督學習、無監督學習和強化學習是三種核心方法，它們在解決不同類型的問題時發揮著重要作用。

1. 監督學習（Supervised Learning）:

在監督學習中，模型通過已標記的數據進行訓練，從而學習到輸入數據和對應的輸出標籤之間的關係。這意味著對於給定的輸入，模型可以預測其對應的輸出。例如，給定房屋的特徵（如面積、地理位置等），模型可以預測其價格。監督學習的目標是使模型能夠通過已知數據進行訓練，從而實現對未知數據的準確預測。

舉例來說，想像一下你正在學習辨識不同品種的狗。在監督學習中，你的教練會向你展示各種各樣的狗的圖片，並告訴你每張圖片對應的狗的品種。這些標註的圖片就像是標記的數據，而品種名稱則是標籤。通過觀察這些標記的數據，你開始學習到不同品種狗的特徵和特點，從而可以在看到新的狗時準確地辨識它們的品種。

早期的監督學習方法包括感知器和線性回歸模型，隨著深度學習技術的發展，監督學習得到了進一步的推廣和應用。

2. 無監督學習（Unsupervised Learning）:

無監督學習與監督學習相比，不需要標記的數據，而是通過觀察數據的內在結構和模式來進行學習。換句話說，模型嘗試從數據中發現潛在的結構，例如群體、聚類或異常值，以便對數據進行更深入的分析和理解。無監督學習的目標是從數據中發現新的知識或規律，而不需要任何外部的標籤信息。早期的無監督學習方法包括聚類分析、降維和密度估計等。隨著深度學習技術的發展，無監督學習方法也得到了很大的發展，例如自編碼器、生成對抗網絡（GAN）等。

假設你有一大堆未分類的照片，並且想要將它們分成不同的類別，但你不知道如何開始。這時，你可以使用無監督學習的方法。無監督學習就像是在觀察這些照片並嘗試找到它們之間的共同特徵。例如，你可能會注意到一組照片中有很多山景，另一組中有很多海灘景觀。通過將這些照片分為不同的群組，你可以自動地將它們分類為山景和海灘照片，而不需要事先標記它們。

3. 強化學習（Reinforcement Learning）:

強化學習是一種通過與環境的交互來學習最優行為策略的方法。在強化學習中，模型通過試錯和反饋來學習，以使得在特定環境下獲得最大的累積獎勵。這種方法類似於小孩學習走路或運動員進行訓練的過程。通過不斷地與環境進行交互，模型學習到哪些行為會導致更好的結果，從而逐步優化其行為策略。強化學習的應用場景包括機器人控制、遊戲玩法、自動駕駛等領域。近年來，隨著深度強化學習技術的發展，強化學習在更廣泛的領域中得到了應用和推廣。

想像一下你正在玩一款遊戲，你的目標是通過不斷的嘗試和錯誤來學會如何通過關卡。每次你嘗試一個新的動作或策略，遊戲都會根據你的表現給予你積分或獎勵，這些積分和獎勵就像是強化學習中的反饋。通過不斷地嘗試不同的動作，你學會了哪些動作可以讓你獲得更高的積分，從而優化了你的策略，進一步提高了遊戲中的表現。

拐點：站在AI顛覆世界的前夜(by 萬維鋼)

---

Transformer是一種神經網絡架構，最初由Google的研究團隊於2017年提出，用於自然語言處理任務，特別是在機器翻譯方面取得了顯著的成就。Transformer架構的核心是自注意力機制（Self-attention mechanism），它允許模型在處理序列數據時能夠同時考慮到所有位置的信息，從而有效地捕捉長距離依賴關係。

reference: All You Need Is Attentation

Talk About Transformation

Transformer 主要體現在監督學習中的應用，對神經網絡的發展產生了重大影響：

解決了長距離依賴問題： 在傳統的循環神經網絡（RNN）和卷積神經網絡（CNN）中，處理長序列數據時常常面臨著梯度消失或梯度爆炸等問題，限制了模型的性能。Transformer通過自注意力機制，使得模型能夠在不受序列長度限制的情況下捕捉長距離的依賴關係，從而提高了模型的性能。
並行計算：由於自注意力機制的特性，Transformer模型中的不同位置之間是並行計算的，這使得Transformer模型能夠更有效地利用計算資源，加速訓練過程。
適應不同任務： Transformer的結構非常靈活，可以通過添加不同的組件和調整模型的大小來適應不同的任務和數據集，例如語言建模、機器翻譯、文本生成等。
推動了預訓練模型的發展： Transformer模型的出現促進了預訓練技術的發展，例如BERT（Bidirectional Encoder Representations from Transformers）、GPT（Generative Pre-trained Transformer）等。這些預訓練模型通過大規模的無標籤數據進行預訓練，然後在特定任務上進行微調，取得了在多個自然語言處理任務上的突出表現。

總的來說，Transformer作為一種革命性的神經網絡架構，通過引入自注意力機制解決了傳統神經網絡中存在的問題，並推動了自然語言處理等領域的發展。

---

GPT（Generative Pre-Trained Transformer）是一種基於 Transformer 架構的預訓練生成式模型，它可以通過預先訓練來學習自然語言的統計結構和語義信息，然後可以用於各種 NLP 任務，包括文本生成、機器翻譯、文本分類等。

Transformer 架構：Transformer 是一種用於處理序列數據的神經網絡架構，特別適用於自然語言處理（NLP）任務。它以自注意力機制為核心，能夠處理不同長度的輸入序列，並在各種 NLP 任務中表現出色。
Pre-Trained 預訓練：指在特定任務之前，模型已經通過大量未標記的數據進行了訓練。在這個階段，模型學習了數據的統計特性和語義結構，而不是針對特定任務進行了最終的微調。
Generative 生成式模型: 生成式模型是指具有生成能力的模型，能夠根據給定的輸入生成相應的輸出。這種模型能夠根據輸入的信息生成新的數據，例如一幅畫、一篇文章或者一首詩。典型的生成性神經網路訓練方法是使用兩個相互對抗的網絡：生成器和判別器。生成器負責生成內容，而判別器負責判斷生成內容的質量。這種對抗式訓練的過程促使生成器和判別器相互提高，已經在諸如生成對抗網路（GAN）等模型中得到了廣泛應用。在自然語言處理中，生成式模型可以生成與給定文本相似的新文本，或者根據提示生成連貫的文本。

評分：拐點

Will 進步本拐點

留言

留言分享你的想法！

Will 進步本

9會員

283內容數

歡迎來到「Will 進步本」！我們將探索計算機科學、商用英文和生成式AI。從基礎到前沿，共同學習和交流，拓展知識視野，啟發創新思維

Will 進步本的其他內容

2024/09/25

苦澀的教訓：學習與搜索是AI的未來

隨著人工智能（AI）的飛速發展，研究人員不斷尋求最佳途徑來實現更加智能化的系統。無論是在遊戲、語言處理還是機器視覺領域，人工智能系統的性能有了顯著提升。然而，在這一進程中，一些關鍵的問題也浮現出來：AI應該依賴於人類設計的專家知識還是依賴於數據和計算能力的自我學習？這個問題的答案可以

2024/09/25

苦澀的教訓：學習與搜索是AI的未來

2024/09/16

閱讀 Nexus: 虛假資訊與群體失控

source: 精英日課赫拉利在他的新書中強調，他撰寫這本書的主要目的，是希望人類能夠通過做出明智的選擇，來避免最糟糕的結果。他進一步解釋：「歷史的研究重點並非‘過去’，而是‘變化’。歷史能告訴我們，什麼是恆常不變的，什麼是正在改變的，以及變革是如何發生的。」比如，我們回顧工業革命的歷史，不僅是

2024/09/16

閱讀 Nexus: 虛假資訊與群體失控

2024/09/09

閱讀 Nexus: 虛構信息的力量：為什麼我們更容易接受與共鳴

在Yuval Noah Harari的新書中，他深入探討了為什麼帶有虛構元素的信息比純粹的真相更容易獲得人們的認可與共鳴，並且往往傳播得更快。Harari提出了兩個關鍵的理由，幫助我們理解這一現象。 1. 虛構信息的簡單性與人類心理需求 Harari的第一個觀點是，虛構的信息往往更簡單直接，

2024/09/09

閱讀 Nexus: 虛構信息的力量：為什麼我們更容易接受與共鳴

看更多

你可能也想看

黛•Adele的生活隨筆

塔羅入門指南｜塔羅師推薦蝦皮雙11必買塔羅牌、占卜布與收納小物

想開始學塔羅卻不知道要準備哪些工具？這篇整理塔羅新手必備好物清單，從塔羅牌、塔羅布到收納袋與香氛噴霧一次入手。趁蝦皮雙11優惠打造專屬占卜空間，還能加入蝦皮分潤計畫，用分享創造收入。

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

黛•Adele的生活隨筆

塔羅入門指南｜塔羅師推薦蝦皮雙11必買塔羅牌、占卜布與收納小物

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

渡狼／DL

[蝦皮分潤計畫X雙11購物季] 魔法少年賈修扭蛋系列開箱！

今天不只要分享蝦皮分潤計畫，也想分享最近到貨的魔法少年賈修扭蛋開箱，還有我的雙11購物清單，漫畫、文具、Switch2、後背包......雙11優惠真的超多，如果有什麼一直想買卻遲遲還沒下手的東西，最適合趁這個購物季趕緊下單！

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

渡狼／DL

[蝦皮分潤計畫X雙11購物季] 魔法少年賈修扭蛋系列開箱！

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

普普文創

【文創漫談】人工智慧與機器學習 | 如何利用AI | 增強能力

人工智慧是什麼？人工智慧（Artificial Intelligence, AI）簡單來說，就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序，可以執行許多原本需要人類智慧才能完成的工作，例如：語音辨識：讓電腦聽懂人類的語言，像是 Siri、Google As

#文創漫談#人工智慧與機器學習#如何利用AI

2024/07/30

普普文創

【文創漫談】人工智慧與機器學習 | 如何利用AI | 增強能力

#文創漫談#人工智慧與機器學習#如何利用AI

2024/07/30

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

本文要探討AI的任務與實戰場景。AI技術已深入生活各層面，從違約預測到都市交通管理。AI任務主要有三類：數值型資料處理、自然語言處理（NLP）和電腦影像辨識。時間序列資料和強化學習方法（如AlphaGo）也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化，了解這些基礎有助選擇適合研究方向

#ChatGPT#AlphaGo#人工智慧

2024/07/19

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

#ChatGPT#AlphaGo#人工智慧

2024/07/19

談心說地

AI的世界：創新與潛力

AI的世界充滿了創新和潛力，涵蓋了許多領域，包括但不限於機器學習，自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的，既帶來了巨大的機遇，也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡，確保AI技術的應用能夠真正造福人類。

2024/07/14

2024/07/14

本文介紹了AI助手在數據收集和訓練過程中的工作原理和不斷進步的過程。關注的內容包括從公開的網絡資源、書籍、文章等渠道收集數據，數據的清洗和結構化處理，知識庫的增量更新以及訓練算法和模型的優化。如果大家對AI助手的發展還有任何其他感興趣的話題或建議，歡迎隨時告訴我們，讓我們共同探索，攜手進步。

2024/07/11

2024/07/11

本文介紹自我監督學習的概念和訓練方式，以BERT和GPT為例，深入探討Masking Input及Fine-Tune的實際操作和可應用性。

#機器學習#深度學習#ChatGPT

2024/05/16

dab戴伯的沙龍

BERT與GPT: 自監督學習的大型模型

本文介紹自我監督學習的概念和訓練方式，以BERT和GPT為例，深入探討Masking Input及Fine-Tune的實際操作和可應用性。

#機器學習#深度學習#ChatGPT

2024/05/16

Will 進步本

拐點 #003: GPT 的名稱怎麼來的

在機器學習領域中，監督學習、無監督學習和強化學習是三種核心方法，它們在解決不同類型的問題時發揮著重要作用。

2024/05/12

Will 進步本

拐點 #003: GPT 的名稱怎麼來的

在機器學習領域中，監督學習、無監督學習和強化學習是三種核心方法，它們在解決不同類型的問題時發揮著重要作用。

2024/05/12

ezra.share.injoy

學習筆記【生成式AI導論 2024】第4講：訓練不了人工智慧？你可以訓練你自己 (中) — 拆解問題與使用工具

延續上週提到的，「有哪些不訓練模型的情況下，能夠強化語言模型的能力」，這堂課接續介紹其中第 3、4 個方法

#AI#生成式AI#學習

2024/03/10

ezra.share.injoy

學習筆記【生成式AI導論 2024】第4講：訓練不了人工智慧？你可以訓練你自己 (中) — 拆解問題與使用工具

延續上週提到的，「有哪些不訓練模型的情況下，能夠強化語言模型的能力」，這堂課接續介紹其中第 3、4 個方法

#AI#生成式AI#學習

2024/03/10

ezra.share.injoy

學習筆記【生成式AI導論 2024】第3講：訓練不了人工智慧？你可以訓練你自己 (上) — 神奇咒語與提供更多資訊

這一節課說明，如何透過改變給模型的指示或咒語（prompt），來得到不同的結果。如果直接說結論的話會是，在今天語言模型的能力之下，我們只要交代清楚任務就好，可以包括背景以及需求。而這節課很像是一堂模型咒語的歷史課 XD

#AI#生成式AI#學習

2024/03/03

ezra.share.injoy

學習筆記【生成式AI導論 2024】第3講：訓練不了人工智慧？你可以訓練你自己 (上) — 神奇咒語與提供更多資訊

#AI#生成式AI#學習

2024/03/03

美國人力資源港 - 九思觀點

何謂「人工智能」？What is AI?

AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域，包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性，還可解決複雜的問題和挑戰。

2024/02/23

2024/02/23

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News