AI說書 - 從0開始 - 199 | OpenAI GPT 之參數量級變化

發佈於三分鐘學AI

更新於 2024/10/02發佈於 2024/10/02閱讀時間約 1 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

光從 2017 年到 2020 年，參數數量就從原始 Transformer 模型中的 65M 個參數增加到 GPT-3 模型中的 175B 個參數，統計如下表所示：

raw-image

有關 GPT-4 模型架構的資訊很少，OpenAI 尚未正式揭露 GPT-4 架構的細節，然而，他們對系統進行了優化，並在知名考試和評估中獲得了高分，如以下 GPT-4 技術報告 (2023 年 3 月 23 日，第 5 頁) 的摘錄所示：

raw-image

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AIAI從0開始-第七章

留言

留言分享你的想法！

Learn AI 不 BI

225會員

628內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2024/10/24

AI說書 - 從0開始 - 223 | 第七章額外閱讀項目

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 193 | 第七章引言到 AI說書 - 從0開始 - 222 | GPT 4 & RAG 測試，我們完成書籍：Transformers

2024/10/24

AI說書 - 從0開始 - 223 | 第七章額外閱讀項目

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 193 | 第七章引言到 AI說書 - 從0開始 - 222 | GPT 4 & RAG 測試，我們完成書籍：Transformers

2024/10/23

AI說書 - 從0開始 - 222 | GPT 4 & RAG 測試

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：依賴的安裝：AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 關鍵字偵測：AI說書 - 從0開始 - 219 |

2024/10/23

AI說書 - 從0開始 - 222 | GPT 4 & RAG 測試

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：依賴的安裝：AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 關鍵字偵測：AI說書 - 從0開始 - 219 |

2024/10/22

AI說書 - 從0開始 - 221 | GPT 4 & RAG 實作

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：依賴的安裝：AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 關鍵字偵測：AI說書 - 從0開始 - 219 |

2024/10/22

AI說書 - 從0開始 - 221 | GPT 4 & RAG 實作

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：依賴的安裝：AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 關鍵字偵測：AI說書 - 從0開始 - 219 |

你可能也想看

方格子 vocus 官方沙龍

沙龍介面新登場！自訂你的創作空間，讓好內容被看見

沙龍一直是創作與交流的重要空間，這次 vocus 全面改版了沙龍介面，就是為了讓好內容被好好看見！你可以自由編排你的沙龍首頁版位，新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。改版完成後可以在社群媒體分享新版面，並標記 @vocus.official⁠ ♥️ ⁠

#vocus#方格子#方格子沙龍

2025/06/12

方格子 vocus 官方沙龍

沙龍介面新登場！自訂你的創作空間，讓好內容被看見

沙龍一直是創作與交流的重要空間，這次 vocus 全面改版了沙龍介面，就是為了讓好內容被好好看見！你可以自由編排你的沙龍首頁版位，新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。改版完成後可以在社群媒體分享新版面，並標記 @vocus.official⁠ ♥️ ⁠

#vocus#方格子#方格子沙龍

2025/06/12

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

每年4月、5月都是最多稅要繳的月份，當然大部份的人都是有機會繳到「綜合所得稅」，只是相當相當多人還不知道，原來繳給政府的稅！可以透過一些有活動的銀行信用卡或電子支付來繳，從繳費中賺一點點小確幸！就是賺個１%~2%大家也是很開心的，因為你們把沒回饋變成有回饋，就是用卡的最高境界所得稅線上申報

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

每年4月、5月都是最多稅要繳的月份，當然大部份的人都是有機會繳到「綜合所得稅」，只是相當相當多人還不知道，原來繳給政府的稅！可以透過一些有活動的銀行信用卡或電子支付來繳，從繳費中賺一點點小確幸！就是賺個１%~2%大家也是很開心的，因為你們把沒回饋變成有回饋，就是用卡的最高境界所得稅線上申報

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

Learn AI 不 BI

AI說書 - 從0開始 - 277 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化及 AI說書 - 從0開始 - 276 | OpenAI Transf

#AI#ai#PromptEngineering

2024/12/26

Learn AI 不 BI

AI說書 - 從0開始 - 277 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化及 AI說書 - 從0開始 - 276 | OpenAI Transf

#AI#ai#PromptEngineering

2024/12/26

Learn AI 不 BI

AI說書 - 從0開始 - 276 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化的操作，以下繼續：我們可以提出一個更好的解釋，並要求查看得分細節，這些

#AI#ai#PromptEngineering

2024/12/25

Learn AI 不 BI

AI說書 - 從0開始 - 276 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化的操作，以下繼續：我們可以提出一個更好的解釋，並要求查看得分細節，這些

#AI#ai#PromptEngineering

2024/12/25

Learn AI 不 BI

AI說書 - 從0開始 - 243 | 微調 GPT 模型與 GPT4 比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/10

Learn AI 不 BI

AI說書 - 從0開始 - 243 | 微調 GPT 模型與 GPT4 比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/10

Learn AI 不 BI

AI說書 - 從0開始 - 240 | 微調 GPT 模型之推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/07

Learn AI 不 BI

AI說書 - 從0開始 - 240 | 微調 GPT 模型之推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/07

Learn AI 不 BI

AI說書 - 從0開始 - 239 | 微調 GPT 模型之推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/06

Learn AI 不 BI

AI說書 - 從0開始 - 239 | 微調 GPT 模型之推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/06

Learn AI 不 BI

AI說書 - 從0開始 - 238 | 微調 GPT 模型之推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/05

Learn AI 不 BI

AI說書 - 從0開始 - 238 | 微調 GPT 模型之推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/05

Learn AI 不 BI

AI說書 - 從0開始 - 234 | 微調 GPT 模型的資料集檢查

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/01

Learn AI 不 BI

AI說書 - 從0開始 - 234 | 微調 GPT 模型的資料集檢查

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/11/01

Learn AI 不 BI

AI說書 - 從0開始 - 233 | 微調 GPT 模型的資料集檢查

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/10/31

Learn AI 不 BI

AI說書 - 從0開始 - 233 | 微調 GPT 模型的資料集檢查

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/10/31

Learn AI 不 BI

AI說書 - 從0開始 - 203 | OpenAI GPT Decoder 架構

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們現在明白了 OpenAI 團隊專注於語言建模，因此，保留掩蔽注意力子層是合理的，Brown 等人於 2020 年顯著增大了僅包含解碼器的 Transformer 模

#AI#ai#PromptEngineering

2024/10/06

Learn AI 不 BI

AI說書 - 從0開始 - 203 | OpenAI GPT Decoder 架構

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們現在明白了 OpenAI 團隊專注於語言建模，因此，保留掩蔽注意力子層是合理的，Brown 等人於 2020 年顯著增大了僅包含解碼器的 Transformer 模

#AI#ai#PromptEngineering

2024/10/06

Learn AI 不 BI

AI說書 - 從0開始 - 199 | OpenAI GPT 之參數量級變化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。光從 2017 年到 2020 年，參數數量就從原始 Transformer 模型中的 65M 個參數增加到 GPT-3 模型中的 175B 個參數，統計如下表所示：

#AI#ai#PromptEngineering

2024/10/02

Learn AI 不 BI

AI說書 - 從0開始 - 199 | OpenAI GPT 之參數量級變化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。光從 2017 年到 2020 年，參數數量就從原始 Transformer 模型中的 65M 個參數增加到 GPT-3 模型中的 175B 個參數，統計如下表所示：

#AI#ai#PromptEngineering

2024/10/02

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News