AI說書 - 從0開始 - 202 | OpenAI GPT 設計動機

發佈於三分鐘學AI

2024/10/05 更新2024/10/05 發佈閱讀 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

OpenAI 正在實現訓練模型並直接運行下游任務的目標，而無需進一步微調，這驚人的進步可以分為四個階段：

Fine-Tuning 的意思是我們在前面的章節中探討過的，訓練 Transformer 模型，然後針對下游任務進行微調，Radford 等人於 2018 年設計了許多微調任務，OpenAI 團隊隨後透過以下步驟逐步將任務數量減少到 0
Few-Shot 是一個重大進步，在 GPT 模型已經訓練完成後，當需要模型進行推理時，我們會提供一些範例來展示需要完成的任務，這些範例作為條件信息，取代了傳統的權重更新過程，這是 GPT 團隊故意排除的，我們將通過提供上下文來對模型進行條件設定
One-Shot 將這一過程進一步推進，訓練好的 GPT 模型只會被提供一個下游任務的範例，這過程中同樣不允許進行權重更新
Zero-Shot 是最終目標，訓練好的 GPT 模型在沒有任何下游任務範例的情況下進行推理

這些方法中的每一種都有不同程度的效率，OpenAI GPT 團隊努力製作這些最先進的 Transformer 模型，我們現在可以解釋 GPT 模型架構的動機：

通過大量訓練教導 Transformer 模型如何學習一門語言
專注於通過上下文條件設置進行語言建模
Transformer 以一種全新的方式利用上下文進行文本補全，它不再耗費資源去學習下游任務，而是專注於理解輸入並根據任何任務進行推理
通過掩蔽輸入序列的一部分來尋找高效的模型訓練方法，迫使 Transformer 以機器智慧進行思考，因此，儘管機器智慧不是人類智慧，但它是高效的

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AIAI從0開始-第七章

留言

留言分享你的想法！

Learn AI 不 BI

240會員

912內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2024/10/24

AI說書 - 從0開始 - 223 | 第七章額外閱讀項目

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 193 | 第七章引言到 AI說書 - 從0開始 - 222 | GPT 4 & RAG 測試，我們完成書籍：Transformers

2024/10/24

AI說書 - 從0開始 - 223 | 第七章額外閱讀項目

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 193 | 第七章引言到 AI說書 - 從0開始 - 222 | GPT 4 & RAG 測試，我們完成書籍：Transformers

2024/10/23

AI說書 - 從0開始 - 222 | GPT 4 & RAG 測試

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：依賴的安裝：AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 關鍵字偵測：AI說書 - 從0開始 - 219 |

2024/10/23

AI說書 - 從0開始 - 222 | GPT 4 & RAG 測試

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：依賴的安裝：AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 關鍵字偵測：AI說書 - 從0開始 - 219 |

2024/10/22

AI說書 - 從0開始 - 221 | GPT 4 & RAG 實作

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：依賴的安裝：AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 關鍵字偵測：AI說書 - 從0開始 - 219 |

2024/10/22

AI說書 - 從0開始 - 221 | GPT 4 & RAG 實作

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：依賴的安裝：AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 關鍵字偵測：AI說書 - 從0開始 - 219 |

你可能也想看

雙11必看！我在蝦皮買過最划算的商品＋購物攻略全公開

想在蝦皮雙11買到最划算？這篇文章將分享作者精選的蝦皮高CP值商品，包含HERAN禾聯冷氣、HITACHI日立冰箱、DJI無線麥克風、FUJIFILM拍立得，並提供蝦皮雙11優惠券領取教學、省錢技巧，以及蝦皮分潤計畫介紹，讓你買得開心、省得多！

#雙11#分享#蝦皮

2025/11/05

雙11必看！我在蝦皮買過最划算的商品＋購物攻略全公開

想在蝦皮雙11買到最划算？這篇文章將分享作者精選的蝦皮高CP值商品，包含HERAN禾聯冷氣、HITACHI日立冰箱、DJI無線麥克風、FUJIFILM拍立得，並提供蝦皮雙11優惠券領取教學、省錢技巧，以及蝦皮分潤計畫介紹，讓你買得開心、省得多！

#雙11#分享#蝦皮

2025/11/05

涵流筆記 HanFlow

蝦皮1111購物節攻略：全站0元起免運！我推薦的高CP值購物清單與省錢秘訣

2025 蝦皮 1111 購物節又來了！分享三大必買原因：全站 $0 起免運、多重優惠疊加、便利取貨。此外，推薦兩款高 CP 值的即食拉麵（無印良品即食迷你拉麵、維力迷你麵野菜拉麵），並分享如何透過「蝦皮分潤計畫」放大效益，開心購物之餘還能獲得額外收益！

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

涵流筆記 HanFlow

蝦皮1111購物節攻略：全站0元起免運！我推薦的高CP值購物清單與省錢秘訣

2025 蝦皮 1111 購物節又來了！分享三大必買原因：全站 $0 起免運、多重優惠疊加、便利取貨。此外，推薦兩款高 CP 值的即食拉麵（無印良品即食迷你拉麵、維力迷你麵野菜拉麵），並分享如何透過「蝦皮分潤計畫」放大效益，開心購物之餘還能獲得額外收益！

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

Learn AI 不 BI

AI說書 - 從0開始 - 277 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化及 AI說書 - 從0開始 - 276 | OpenAI Transf

#AI#ai#PromptEngineering

2024/12/26

Learn AI 不 BI

AI說書 - 從0開始 - 277 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化及 AI說書 - 從0開始 - 276 | OpenAI Transf

#AI#ai#PromptEngineering

2024/12/26

Learn AI 不 BI

AI說書 - 從0開始 - 276 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化的操作，以下繼續：我們可以提出一個更好的解釋，並要求查看得分細節，這些

#AI#ai#PromptEngineering

2024/12/25

Learn AI 不 BI

AI說書 - 從0開始 - 276 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化的操作，以下繼續：我們可以提出一個更好的解釋，並要求查看得分細節，這些

#AI#ai#PromptEngineering

2024/12/25

Learn AI 不 BI

AI說書 - 從0開始 - 243 | 微調 GPT 模型與 GPT4 比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/10

Learn AI 不 BI

AI說書 - 從0開始 - 243 | 微調 GPT 模型與 GPT4 比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/10

Learn AI 不 BI

AI說書 - 從0開始 - 240 | 微調 GPT 模型之推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/07

Learn AI 不 BI

AI說書 - 從0開始 - 240 | 微調 GPT 模型之推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/07

Learn AI 不 BI

AI說書 - 從0開始 - 239 | 微調 GPT 模型之推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/06

Learn AI 不 BI

AI說書 - 從0開始 - 239 | 微調 GPT 模型之推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/06

Learn AI 不 BI

AI說書 - 從0開始 - 238 | 微調 GPT 模型之推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/05

Learn AI 不 BI

AI說書 - 從0開始 - 238 | 微調 GPT 模型之推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/05

Learn AI 不 BI

AI說書 - 從0開始 - 234 | 微調 GPT 模型的資料集檢查

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/01

Learn AI 不 BI

AI說書 - 從0開始 - 234 | 微調 GPT 模型的資料集檢查

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/01

Learn AI 不 BI

AI說書 - 從0開始 - 210 | OpenAI 其他應用

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。可以造訪 https://platform.openai.com/examples 看看其他有趣應用：注意，OpenAI GPT 模型並未預訓練來執行這些任務，

#AI#ai#PromptEngineering

2024/10/11

Learn AI 不 BI

AI說書 - 從0開始 - 210 | OpenAI 其他應用

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。可以造訪 https://platform.openai.com/examples 看看其他有趣應用：注意，OpenAI GPT 模型並未預訓練來執行這些任務，

#AI#ai#PromptEngineering

2024/10/11

Learn AI 不 BI

AI說書 - 從0開始 - 206 | OpenAI ChatGPT 使用

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。生成式 AI 和 GPT 助手將滲透到日常應用中，從軟體開發的角度來看，未來將與過去大不相同，類似 ChatGPT 的模型將大大提高日常軟體開發的生產力，我們將釋放 G

#AI#ai#PromptEngineering

2024/10/08

Learn AI 不 BI

AI說書 - 從0開始 - 206 | OpenAI ChatGPT 使用

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。生成式 AI 和 GPT 助手將滲透到日常應用中，從軟體開發的角度來看，未來將與過去大不相同，類似 ChatGPT 的模型將大大提高日常軟體開發的生產力，我們將釋放 G

#AI#ai#PromptEngineering

2024/10/08

Learn AI 不 BI

AI說書 - 從0開始 - 203 | OpenAI GPT Decoder 架構

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們現在明白了 OpenAI 團隊專注於語言建模，因此，保留掩蔽注意力子層是合理的，Brown 等人於 2020 年顯著增大了僅包含解碼器的 Transformer 模

#AI#ai#PromptEngineering

2024/10/06

Learn AI 不 BI

AI說書 - 從0開始 - 203 | OpenAI GPT Decoder 架構

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們現在明白了 OpenAI 團隊專注於語言建模，因此，保留掩蔽注意力子層是合理的，Brown 等人於 2020 年顯著增大了僅包含解碼器的 Transformer 模

#AI#ai#PromptEngineering

2024/10/06

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News