embeddings

AI說書 - 從0開始 - 279 | 第九章額外閱讀

2024/12/28

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 247 | 第九章引言到 AI說書 - 從0開始 - 278 | 模型視覺化極限與人為介入，我們完成書籍：Transformers f

蕭帥哥

2024/12/29

AI說書 - 從0開始 - 202 | OpenAI GPT 設計動機

2024/10/05

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 OpenAI 正在實現訓練模型並直接運行下游任務的目標，而無需進一步微調，這驚人的進步可以分為四個階段： Fine-Tuning 的意思是我們在前面的章節中探討過的，

AI說書 - 從0開始 - 201 | OpenAI GPT 理念說明

2024/10/04

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從一開始，OpenAI 的研究團隊就由 Radford 等人領導，2018 年想要將 Transformer 從先前訓練的模型轉換為 GPT 模型，目標是根據未標記的資

AI說書 - 從0開始 - 200 | OpenAI GPT 之參數量級變化

2024/10/03

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 ChatGPT 是涵蓋 GPT-3.5-turbo、GPT-4、GPT-4V 和未來可能的改進的總稱，架構的規模同時演進：模型的層數從原始 Transformer

AI說書 - 從0開始 - 199 | OpenAI GPT 之參數量級變化

2024/10/02

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。光從 2017 年到 2020 年，參數數量就從原始 Transformer 模型中的 65M 個參數增加到 GPT-3 模型中的 175B 個參數，統計如下表所示：

AI說書 - 從0開始 - 198 | OpenAI GPT 之架構引言

2024/10/01

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 2020 年 Brown 等人描述了 OpenAI GPT-3 模型的訓練，該模型包含 1750 億個參數，該模型是在巨大的資料集上訓練的，例如從 Common Cra

AI說書 - 從0開始 - 197 | 第七章總覽

2024/09/30

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 194 | 第七章總覽中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型，而在 AI說書 - 從0開始 - 195 | 第

AI說書 - 從0開始 - 196 | 第七章總覽

2024/09/29