AI說書 - 從0開始 - 198 | OpenAI GPT 之架構引言

發佈於三分鐘學AI

2024/10/01 更新2024/10/01 發佈閱讀 3 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

2020 年 Brown 等人描述了 OpenAI GPT-3 模型的訓練，該模型包含 1750 億個參數，該模型是在巨大的資料集上訓練的，例如從 Common Crawl 資料中提取的 4000 億個位元組對，OpenAI 在具有 285000 個 CPU 和 10000 個 GPU 的 Microsoft Azure 超級電腦上執行訓練。

OpenAI 的 GPT-3 模型及其超級電腦的機器智慧引領 Brown 等人於 2020 進行零樣本實驗，這個想法是使用經過訓練的模型來執行下游任務，而無需進一步訓練參數，我們的目標是讓經過訓練的模型能夠透過 API 直接進入多任務生產，甚至可以執行未經訓練的任務。

超人類雲端人工智慧模式的時代誕生了，OpenAI 的 API 不需要高階軟體技能或人工智慧知識，你可能想知道為什麼我使用“超人類”這個詞，GPT-3 和 GPT-4 模型（以及即將推出的更強大的模型）在許多情況下可以執行許多任務，至少與人類一樣好，目前，有必要了解 GPT 模型是如何建構和運作的，才能領略其中的魔力。

GPT-4 建構於 GPT-3 之上，而 GPT-3 又建構於 GPT-2 架構之上，然而，經過充分訓練的 GPT-3 Transformer 是一個基礎模型：

基礎模型可以完成許多未經訓練的任務
透過同質化，GPT-3/GPT-4的生成能力透過統一的架構適用於許多自然語言處理任務，包括程式設計任務

從 2017 年底到 2020 年上半年，Transformers 從訓練到微調，最後到零樣本模型，只花了不到三年的時間，下游多任務不會更新訓練好的模型參數，這為 NLP/NLU 任務開啟了新時代，Transformer 從針對 NLP 任務訓練的小型模型轉變為幾乎不需要微調的模型的速度是驚人的。

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AIAI從0開始-第七章

留言

留言分享你的想法！

Learn AI 不 BI

242會員

937內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2024/10/24

AI說書 - 從0開始 - 223 | 第七章額外閱讀項目

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 193 | 第七章引言到 AI說書 - 從0開始 - 222 | GPT 4 & RAG 測試，我們完成書籍：Transformers

2024/10/24

AI說書 - 從0開始 - 223 | 第七章額外閱讀項目

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 193 | 第七章引言到 AI說書 - 從0開始 - 222 | GPT 4 & RAG 測試，我們完成書籍：Transformers

2024/10/23

AI說書 - 從0開始 - 222 | GPT 4 & RAG 測試

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：依賴的安裝：AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 關鍵字偵測：AI說書 - 從0開始 - 219 |

2024/10/23

AI說書 - 從0開始 - 222 | GPT 4 & RAG 測試

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：依賴的安裝：AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 關鍵字偵測：AI說書 - 從0開始 - 219 |

2024/10/22

AI說書 - 從0開始 - 221 | GPT 4 & RAG 實作

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：依賴的安裝：AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 關鍵字偵測：AI說書 - 從0開始 - 219 |

2024/10/22

AI說書 - 從0開始 - 221 | GPT 4 & RAG 實作

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：依賴的安裝：AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 關鍵字偵測：AI說書 - 從0開始 - 219 |