AI說書 - 從0開始 - 201 | OpenAI GPT 理念說明

發佈於三分鐘學AI

更新於 2024/10/04發佈於 2024/10/04閱讀時間約 3 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

從一開始，OpenAI 的研究團隊就由 Radford 等人領導，2018 年想要將 Transformer 從先前訓練的模型轉換為 GPT 模型，目標是根據未標記的資料訓練 Transformer，讓注意力層從無監督資料中學習語言是明智之舉，OpenAI 不是教導 Transformer 執行特定的自然語言處理任務，而是訓練 Transformer 學習語言。

無監督一詞定義了沒有標籤的訓練，從這個意義上說，GPT 模型經歷了無監督訓練，然而，當它在訓練期間預測 Token 時，會將輸出與實際的完整輸入序列進行比較，以計算損失、尋找梯度並執行反向傳播，從這個意義上說，GPT 是自我監督的，而不是完全無監督的，當您看到與生成模型相關的術語「無監督」時，要記住這一點。

OpenAI 希望創建一個與任務無關的模型，因此，他們開始根據原始資料訓練 Transformer 模型，而不是依賴專家的標記資料，標記資料非常耗時，並且會大大減慢 Transformer 的訓練過程。第一步是從 Transformer 模型的無監督訓練開始，然後他們只會微調模型的監督學習。

第一版 GPT Transformer 模型的令人鼓舞的結果很快就導致 Radford 等人於 2019 提出零樣本轉移模型，他們的核心理念是繼續訓練 GPT 模型以從原始文本中學習，然後，他們進一步研究，重點關注透過無監督分佈範例進行語言建模，目標是一旦經過訓練的 GPT 模型透過強化訓練理解了一種語言，就可以將此概念推廣到任何下游任務。

GPT 模型迅速從 117M 參數發展到 345M 參數，再發展到其他大小，然後發展到 1542M 參數，微調量急劇減少。

這鼓勵 OpenAI 走得更遠，Brown 等人於 2020 年繼續假設條件機率 Transformer 模型可以進行深度訓練，並且能夠產生出色的結果，而無需對下游任務進行微調。

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AIAI從0開始-第七章

Learn AI 不 BI

217會員

555內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言

留言分享你的想法！

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 200 | OpenAI GPT 之參數量級變化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 ChatGPT 是涵蓋 GPT-3.5-turbo、GPT-4、GPT-4V 和未來可能的改進的總稱，架構的規模同時演進：模型的層數從原始 Transformer

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 199 | OpenAI GPT 之參數量級變化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。光從 2017 年到 2020 年，參數數量就從原始 Transformer 模型中的 65M 個參數增加到 GPT-3 模型中的 175B 個參數，統計如下表所示：

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 198 | OpenAI GPT 之架構引言

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 2020 年 Brown 等人描述了 OpenAI GPT-3 模型的訓練，該模型包含 1750 億個參數，該模型是在巨大的資料集上訓練的，例如從 Common Cra

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 197 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 194 | 第七章總覽中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型，而在 AI說書 - 從0開始 - 195 | 第

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 196 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 194 | 第七章總覽中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型，而在 AI說書 - 從0開始 - 195 | 第

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 195 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 194 | 第七章總覽中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型，我們先探討「改進」的部分。本章的改進重點

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 200 | OpenAI GPT 之參數量級變化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 ChatGPT 是涵蓋 GPT-3.5-turbo、GPT-4、GPT-4V 和未來可能的改進的總稱，架構的規模同時演進：模型的層數從原始 Transformer

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 199 | OpenAI GPT 之參數量級變化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。光從 2017 年到 2020 年，參數數量就從原始 Transformer 模型中的 65M 個參數增加到 GPT-3 模型中的 175B 個參數，統計如下表所示：

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 198 | OpenAI GPT 之架構引言

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 2020 年 Brown 等人描述了 OpenAI GPT-3 模型的訓練，該模型包含 1750 億個參數，該模型是在巨大的資料集上訓練的，例如從 Common Cra

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 197 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 194 | 第七章總覽中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型，而在 AI說書 - 從0開始 - 195 | 第

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 196 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 194 | 第七章總覽中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型，而在 AI說書 - 從0開始 - 195 | 第

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 195 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 194 | 第七章總覽中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型，我們先探討「改進」的部分。本章的改進重點

#AI #ai #PromptEngineering

你可能也想看

Google News 追蹤

方格子 vocus 官方沙龍

限時 9 折！精選投資理財沙龍推薦｜大盤動盪，知識進場

【vocus 精選投資理財/金融類沙龍，輸入 "moneyback" 年訂閱 9 折】市場動盪時，加碼永遠值得的投資標的——「自己」川普政府再度拋出關稅震撼彈，全球市場應聲重挫，從散戶到專業投資人，都急著找尋買進殺出的訊號，就是現在，輪到知識進場！把握時機讓自己升級，別放過反彈的機會！

#折扣碼 #方案 #投資

柔伊61 穿搭 . 美妝 . 分享生活

提升氛圍感必不可少的單品！( mo店+ 、Bliss BKK )

就能get 同款韓系質感包👜 而且獨家下殺 299元up 讓它成為你的必備單品吧！ - momo優惠折扣碼領取超簡單❤️ 點擊右下角會員中心 - 折價券輸入 FLOWERMOMO 點擊歸戶就能領取商店優惠券啦！ - https://momo.dm/RaFNzR

#momo #穿搭 #時尚單品

姜廷蓉的沙龍

mo店+ S999純銀四葉草項鍊：你的幸運守護神

momo店+ S999純銀四葉草項鍊，精緻細膩，代表愛情、希望、信念與幸運，是送給自己或別人的完美禮物。限時下殺299元起，超取免運！

#首飾 #項鍊 #穿搭

Learn AI 不 BI

AI說書 - 從0開始 - 116 | Google Trax 進行推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型，並在 AI說書 - 從0開始 - 115 載入權重並執行 Tokenizing，現

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 82

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 可以透過繼承預訓練模型 (Pretrained Model) 來微調 (Fine-Tune) 以執行下游任務。 Pretrained Mo

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 30

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。生成式人工智慧模糊了雲端平台、框架、函式庫、語言和模型之間的界線，以下展開幾項事實： OpenAI 部署了一個Transformer API，幾乎不需要程式設計。

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 21

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 20中，闡述GPT模型的Supervised and Unsupervised觀點，接著一樣引述書籍：Transformers f

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 19

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 18中，介紹了OpenAI的GPT模型如何利用Inference的Pipeline產生Token。完整Pipeline可能

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 18

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 17中，介紹了大型語言模型 (LLM)世界裡面常用到的Token，現在我們來談談OpenAI的GPT模型如何利用Inference

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 4

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 2，ChatGPT的根基是一種名為Transformer的Foundation Model，而Transformer依據AI說書 - 從

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 3

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 2，ChatGPT的根基是一種名為Transformer的Foundation Model，我們從Transformer的時間複雜度開始

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 2

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 1，我們從Transformer開始談起： ChatGPT的根基是一種名為Transformer的Foundation Model

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 1

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 0，我們從Transformer開始談起： ChatGPT的火紅使得Transformer架構也跟著成為主流，相關應用從Googl

#AI #ai #PromptEngineering

方格子 vocus 官方沙龍

限時 9 折！精選投資理財沙龍推薦｜大盤動盪，知識進場

【vocus 精選投資理財/金融類沙龍，輸入 "moneyback" 年訂閱 9 折】市場動盪時，加碼永遠值得的投資標的——「自己」川普政府再度拋出關稅震撼彈，全球市場應聲重挫，從散戶到專業投資人，都急著找尋買進殺出的訊號，就是現在，輪到知識進場！把握時機讓自己升級，別放過反彈的機會！

#折扣碼 #方案 #投資

柔伊61 穿搭 . 美妝 . 分享生活

提升氛圍感必不可少的單品！( mo店+ 、Bliss BKK )

就能get 同款韓系質感包👜 而且獨家下殺 299元up 讓它成為你的必備單品吧！ - momo優惠折扣碼領取超簡單❤️ 點擊右下角會員中心 - 折價券輸入 FLOWERMOMO 點擊歸戶就能領取商店優惠券啦！ - https://momo.dm/RaFNzR

#momo #穿搭 #時尚單品

姜廷蓉的沙龍

mo店+ S999純銀四葉草項鍊：你的幸運守護神

momo店+ S999純銀四葉草項鍊，精緻細膩，代表愛情、希望、信念與幸運，是送給自己或別人的完美禮物。限時下殺299元起，超取免運！

#首飾 #項鍊 #穿搭

Learn AI 不 BI

AI說書 - 從0開始 - 116 | Google Trax 進行推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型，並在 AI說書 - 從0開始 - 115 載入權重並執行 Tokenizing，現

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 82

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 可以透過繼承預訓練模型 (Pretrained Model) 來微調 (Fine-Tune) 以執行下游任務。 Pretrained Mo

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 30

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。生成式人工智慧模糊了雲端平台、框架、函式庫、語言和模型之間的界線，以下展開幾項事實： OpenAI 部署了一個Transformer API，幾乎不需要程式設計。

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 21

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 20中，闡述GPT模型的Supervised and Unsupervised觀點，接著一樣引述書籍：Transformers f

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 19

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 18中，介紹了OpenAI的GPT模型如何利用Inference的Pipeline產生Token。完整Pipeline可能

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 18

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 17中，介紹了大型語言模型 (LLM)世界裡面常用到的Token，現在我們來談談OpenAI的GPT模型如何利用Inference

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 4

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 2，ChatGPT的根基是一種名為Transformer的Foundation Model，而Transformer依據AI說書 - 從

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 3

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 2，ChatGPT的根基是一種名為Transformer的Foundation Model，我們從Transformer的時間複雜度開始

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 2

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 1，我們從Transformer開始談起： ChatGPT的根基是一種名為Transformer的Foundation Model

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 1

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 0，我們從Transformer開始談起： ChatGPT的火紅使得Transformer架構也跟著成為主流，相關應用從Googl

#AI #ai #PromptEngineering