embeddings
含有「embeddings」共 154 篇內容
全部內容
發佈日期由新至舊
Learn AI 不 BI
2024/12/28
AI說書 - 從0開始 - 279 | 第九章額外閱讀
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 從 AI說書 - 從0開始 - 247 | 第九章引言 到 AI說書 - 從0開始 - 278 | 模型視覺化極限與人為介入,我們完成書籍:Transformers f
#
AI
#
ai
#
PromptEngineering
13
1
蕭帥哥
1
假期愉快
Learn AI 不 BI
2024/10/05
AI說書 - 從0開始 - 202 | OpenAI GPT 設計動機
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 OpenAI 正在實現訓練模型並直接運行下游任務的目標,而無需進一步微調,這驚人的進步可以分為四個階段: Fine-Tuning 的意思是我們在前面的章節中探討過的,
#
AI
#
ai
#
PromptEngineering
46
留言
Learn AI 不 BI
2024/10/04
AI說書 - 從0開始 - 201 | OpenAI GPT 理念說明
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 從一開始,OpenAI 的研究團隊就由 Radford 等人領導,2018 年想要將 Transformer 從先前訓練的模型轉換為 GPT 模型,目標是根據未標記的資
#
AI
#
ai
#
PromptEngineering
18
留言
Learn AI 不 BI
2024/10/03
AI說書 - 從0開始 - 200 | OpenAI GPT 之參數量級變化
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 ChatGPT 是涵蓋 GPT-3.5-turbo、GPT-4、GPT-4V 和未來可能的改進的總稱,架構的規模同時演進: 模型的層數從原始 Transformer
#
AI
#
ai
#
PromptEngineering
13
留言
Learn AI 不 BI
2024/10/02
AI說書 - 從0開始 - 199 | OpenAI GPT 之參數量級變化
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 光從 2017 年到 2020 年,參數數量就從原始 Transformer 模型中的 65M 個參數增加到 GPT-3 模型中的 175B 個參數,統計如下表所示:
#
AI
#
ai
#
PromptEngineering
14
留言
Learn AI 不 BI
2024/10/01
AI說書 - 從0開始 - 198 | OpenAI GPT 之架構引言
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 2020 年 Brown 等人描述了 OpenAI GPT-3 模型的訓練,該模型包含 1750 億個參數,該模型是在巨大的資料集上訓練的,例如從 Common Cra
#
AI
#
ai
#
PromptEngineering
16
留言
Learn AI 不 BI
2024/09/30
AI說書 - 從0開始 - 197 | 第七章總覽
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 在 AI說書 - 從0開始 - 194 | 第七章總覽 中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型,而在 AI說書 - 從0開始 - 195 | 第
#
AI
#
ai
#
PromptEngineering
11
留言
Learn AI 不 BI
2024/09/29
AI說書 - 從0開始 - 196 | 第七章總覽
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 在 AI說書 - 從0開始 - 194 | 第七章總覽 中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型,而在 AI說書 - 從0開始 - 195 | 第
#
AI
#
ai
#
PromptEngineering
11
留言
Learn AI 不 BI
2024/09/28
AI說書 - 從0開始 - 195 | 第七章總覽
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 在 AI說書 - 從0開始 - 194 | 第七章總覽 中提到會用「改進」和「擴散」兩個面向來探討 OpenAI 模型,我們先探討「改進」的部分。 本章的改進重點
#
AI
#
ai
#
PromptEngineering
11
留言
Learn AI 不 BI
2024/09/27
AI說書 - 從0開始 - 194 | 第七章總覽
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 本章涵蓋以下主題: General Purpose Technologies (GPT) 模型做為通用技術的興起與傳播 OpenAI GPT 模型的架構 從 Fe
#
AI
#
ai
#
PromptEngineering
9
留言