Learn AI 不 BI

AI說書 - 從0開始 - 198 | OpenAI GPT 之架構引言

發佈於三分鐘學AI

更新於 2024/10/01發佈於 2024/10/01閱讀時間約 3 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

2020 年 Brown 等人描述了 OpenAI GPT-3 模型的訓練，該模型包含 1750 億個參數，該模型是在巨大的資料集上訓練的，例如從 Common Crawl 資料中提取的 4000 億個位元組對，OpenAI 在具有 285000 個 CPU 和 10000 個 GPU 的 Microsoft Azure 超級電腦上執行訓練。

OpenAI 的 GPT-3 模型及其超級電腦的機器智慧引領 Brown 等人於 2020 進行零樣本實驗，這個想法是使用經過訓練的模型來執行下游任務，而無需進一步訓練參數，我們的目標是讓經過訓練的模型能夠透過 API 直接進入多任務生產，甚至可以執行未經訓練的任務。

超人類雲端人工智慧模式的時代誕生了，OpenAI 的 API 不需要高階軟體技能或人工智慧知識，你可能想知道為什麼我使用“超人類”這個詞，GPT-3 和 GPT-4 模型（以及即將推出的更強大的模型）在許多情況下可以執行許多任務，至少與人類一樣好，目前，有必要了解 GPT 模型是如何建構和運作的，才能領略其中的魔力。

GPT-4 建構於 GPT-3 之上，而 GPT-3 又建構於 GPT-2 架構之上，然而，經過充分訓練的 GPT-3 Transformer 是一個基礎模型：

基礎模型可以完成許多未經訓練的任務
透過同質化，GPT-3/GPT-4的生成能力透過統一的架構適用於許多自然語言處理任務，包括程式設計任務

從 2017 年底到 2020 年上半年，Transformers 從訓練到微調，最後到零樣本模型，只花了不到三年的時間，下游多任務不會更新訓練好的模型參數，這為 NLP/NLU 任務開啟了新時代，Transformer 從針對 NLP 任務訓練的小型模型轉變為幾乎不需要微調的模型的速度是驚人的。

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AIAI從0開始-第七章

Learn AI 不 BI

202會員

517內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言

留言分享你的想法！

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 197 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 194 | 第七章總覽中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型，而在 AI說書 - 從0開始 - 195 | 第

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 196 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 194 | 第七章總覽中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型，而在 AI說書 - 從0開始 - 195 | 第

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 195 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 194 | 第七章總覽中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型，我們先探討「改進」的部分。本章的改進重點

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 194 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。本章涵蓋以下主題： General Purpose Technologies (GPT) 模型做為通用技術的興起與傳播 OpenAI GPT 模型的架構從 Fe

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 193 | 第七章引言

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 2022 年 11 月，OpenAI ChatGPT 進入主流媒體，引發共鳴，報紙、電視頻道和社群媒體紛紛湧入 OpenAI 的 ChatGPT 網站，關於 ChatG

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 197 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 194 | 第七章總覽中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型，而在 AI說書 - 從0開始 - 195 | 第

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 196 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 194 | 第七章總覽中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型，而在 AI說書 - 從0開始 - 195 | 第

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 195 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 194 | 第七章總覽中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型，我們先探討「改進」的部分。本章的改進重點

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 194 | 第七章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。本章涵蓋以下主題： General Purpose Technologies (GPT) 模型做為通用技術的興起與傳播 OpenAI GPT 模型的架構從 Fe

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 193 | 第七章引言

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 2022 年 11 月，OpenAI ChatGPT 進入主流媒體，引發共鳴，報紙、電視頻道和社群媒體紛紛湧入 OpenAI 的 ChatGPT 網站，關於 ChatG

#AI #ai #PromptEngineering

你可能也想看

Google News 追蹤

Learn AI 不 BI

AI說書 - 從0開始 - 74

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 ChatGPT 在 2022 年底和 2023 年初突然成為主流，震驚了世界，數以千計的任務被提交給這個令人難以置信的生成式人工智慧模型，帶有 GPT-4 的 Chat

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 33

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 32中，展示了OpenAI的API如何使用，儘管 API 可以滿足許多需求，但它們也有其限制，例如，多用途 API 可能在所有任務

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 32

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。想要操作ChatGPT，我們可以參考OpenAI的範例： https://platform.openai.com/examples/default-sql-trans

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 30

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。生成式人工智慧模糊了雲端平台、框架、函式庫、語言和模型之間的界線，以下展開幾項事實： OpenAI 部署了一個Transformer API，幾乎不需要程式設計。

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 29

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在AI說書 - 從0開始 - 28中闡述了一些AI專業者的未來發展方向，現在我們更細分：人工智慧專家在人工智慧某一領域擁有專業知識或技能，包含微調模型、維護和支

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 25

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 24示範了ChatGPT程式的能力，現在我們繼續做下去。 Train a decision tree classifier mod

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 23

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 22解釋Foundation Model與Engines意涵後，我們來試用看看ChatGPT。嘗試問以下問題：Provide a

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 19

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 18中，介紹了OpenAI的GPT模型如何利用Inference的Pipeline產生Token。完整Pipeline可能

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 18

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 17中，介紹了大型語言模型 (LLM)世界裡面常用到的Token，現在我們來談談OpenAI的GPT模型如何利用Inference

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 14

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。已經在AI說書 - 從0開始 - 12以及AI說書 - 從0開始 - 13中見識到TPU的威力了，現在我們把參數放大到真實大型語言模型的規模，看看運算時間的等級。

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 74

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 ChatGPT 在 2022 年底和 2023 年初突然成為主流，震驚了世界，數以千計的任務被提交給這個令人難以置信的生成式人工智慧模型，帶有 GPT-4 的 Chat

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 33

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 32中，展示了OpenAI的API如何使用，儘管 API 可以滿足許多需求，但它們也有其限制，例如，多用途 API 可能在所有任務

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 32

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。想要操作ChatGPT，我們可以參考OpenAI的範例： https://platform.openai.com/examples/default-sql-trans

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 30

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。生成式人工智慧模糊了雲端平台、框架、函式庫、語言和模型之間的界線，以下展開幾項事實： OpenAI 部署了一個Transformer API，幾乎不需要程式設計。

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 29

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在AI說書 - 從0開始 - 28中闡述了一些AI專業者的未來發展方向，現在我們更細分：人工智慧專家在人工智慧某一領域擁有專業知識或技能，包含微調模型、維護和支

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 25

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 24示範了ChatGPT程式的能力，現在我們繼續做下去。 Train a decision tree classifier mod

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 23

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 22解釋Foundation Model與Engines意涵後，我們來試用看看ChatGPT。嘗試問以下問題：Provide a

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 19

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 18中，介紹了OpenAI的GPT模型如何利用Inference的Pipeline產生Token。完整Pipeline可能

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 18

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 17中，介紹了大型語言模型 (LLM)世界裡面常用到的Token，現在我們來談談OpenAI的GPT模型如何利用Inference

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 14

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。已經在AI說書 - 從0開始 - 12以及AI說書 - 從0開始 - 13中見識到TPU的威力了，現在我們把參數放大到真實大型語言模型的規模，看看運算時間的等級。

#AI #ai #PromptEngineering