AI說書 - 從0開始 - 66

LearnAI

發佈於三分鐘學AI

更新於 2024/06/29發佈於 2024/06/29閱讀時間約 3 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

先做個總回顧：

Transformer 架構總覽：AI說書 - 從0開始 - 39
Attention 意圖說明：AI說書 - 從0開始 - 40
Transformer 內的 Encoder 架構總覽：AI說書 - 從0開始 - 41
Input Embedding 意圖說明：AI說書 - 從0開始 - 42
Embedding 訓練方式：AI說書 - 從0開始 - 43
Embedding 結果呈現：AI說書 - 從0開始 - 44
Positional Encoding 功能介紹：AI說書 - 從0開始 - 45
Positional Encoding 畫圖感受：AI說書 - 從0開始 - 46
Positional Encoding 實際計算：AI說書 - 從0開始 - 47
Embedding 與 Positional Encoding 的相似度比較：AI說書 - 從0開始 - 48
Embedding 與 Positional Encoding 的合成方式：AI說書 - 從0開始 - 49
Embedding 與 Positional Encoding 的合成前後討論：AI說書 - 從0開始 - 50
Multi-Head Attention 意圖說明：AI說書 - 從0開始 - 51
Single-Head Attention 數學說明：AI說書 - 從0開始 - 52
Multi-Head Attention 數學說明：AI說書 - 從0開始 - 53
Attention 機制程式說明 - 輸入端：AI說書 - 從0開始 - 53
Attention 機制程式說明 - Query 端：AI說書 - 從0開始 - 54
Attention 機制程式說明 - Key 端：AI說書 - 從0開始 - 54
Attention 機制程式說明 - Value 端：AI說書 - 從0開始 - 55
Attention 機制程式說明 - Query 、 Key 、 Value 結果：AI說書 - 從0開始 - 56
Attention 機制程式說明 - Attention Score 計算：AI說書 - 從0開始 - 57
Attention 機制程式說明 - Attention Score 正規化計算：AI說書 - 從0開始 - 58
Attention 機制程式說明 - 輸出結果計算：AI說書 - 從0開始 - 59
Attention 機制程式說明 - 輸出結果呈現：AI說書 - 從0開始 - 60
Attention 機制程式說明 - 總整理：AI說書 - 從0開始 - 61
Attention 例子回歸 Google 原始模型的提點：AI說書 - 從0開始 - 62
Single-Head 過度到 Multi-Head Attention 程式手法：AI說書 - 從0開始 - 63
Add & Layer Normalization 說明：AI說書 - 從0開始 - 64
Feedforward 說明：AI說書 - 從0開始 - 65

至此講完 Transformer 的 Encoder 部分，而 Decoder 架構如下：

原始 Google 的 Transformer 論文中，其於 Decoder 內，一樣配置 N = 6
一個 Decoder Layer 中，包含三個 Sublayer ，其分別為：

1. Multi-Headed Masked Attention Mechanism
2. Multi-Headed Attention Mechanism
3. Fully Connected Position-Wise Feedforward Network

Learn AI 不 BI三分鐘學AIAI從0開始-第二章

留言

留言分享你的想法！

Learn AI 不 BI

235會員

765內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2024/07/05

AI說書 - 從0開始 - 71

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 37 到 AI說書 - 從0開始 - 70 ，我們完成書籍：Transformers for Natural Language Proc

2024/07/05

AI說書 - 從0開始 - 71

2024/07/04

AI說書 - 從0開始 - 70

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 的重要性已經被公認了，因此在 Hugging Face 中亦有被實作，呼叫方式如下： !pip -q install transformers

2024/07/04

AI說書 - 從0開始 - 70

2024/07/02

AI說書 - 從0開始 - 69

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformers for Natural Language Processing and Computer Vision, 2024 這本書中講 Trainin

2024/07/02

AI說書 - 從0開始 - 69

看更多

你可能也想看

方格子 vocus 官方沙龍

2025 下半場，蝦皮分潤計畫 x vocus 陪你回顧上半年的美好開箱！

2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》，我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物；這次活動不僅送出了許多獎勵，也反映了「內容有價」——創作不只是分享、紀錄，也能用各種不同形式變現、帶來實際收入。

#vocusforBusiness#蝦皮#蝦皮分潤

2025/08/25

方格子 vocus 官方沙龍

2025 下半場，蝦皮分潤計畫 x vocus 陪你回顧上半年的美好開箱！

#vocusforBusiness#蝦皮#蝦皮分潤

2025/08/25

Learn AI 不 BI

AI說書 - 從0開始 - 79

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。如 AI說書 - 從0開始 - 78 所述，經過 AI說書 - 從0開始 - 74 到目前為止的實驗，應可以漸漸感受到 Transformer 模型如何從數學層面漸漸往

#AI#ai#PromptEngineering

2024/07/08

Learn AI 不 BI

AI說書 - 從0開始 - 79

#AI#ai#PromptEngineering

2024/07/08

Learn AI 不 BI

AI說書 - 從0開始 - 66

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先做個總回顧： Transformer 架構總覽：AI說書 - 從0開始 - 39 Attention 意圖說明：AI說書 - 從0開始 - 40 Transfo

#AI#ai#PositionalEncoding

2024/06/29

Learn AI 不 BI

AI說書 - 從0開始 - 66

#AI#ai#PositionalEncoding

2024/06/29

Learn AI 不 BI

AI說書 - 從0開始 - 60

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI#ai#PromptEngineering

2024/06/28

Learn AI 不 BI

AI說書 - 從0開始 - 60

#AI#ai#PromptEngineering

2024/06/28

Learn AI 不 BI

AI說書 - 從0開始 - 59

#AI#ai#PromptEngineering

2024/06/28

Learn AI 不 BI

AI說書 - 從0開始 - 59

#AI#ai#PromptEngineering

2024/06/28

Learn AI 不 BI

AI說書 - 從0開始 - 58

#AI#ai#PromptEngineering

2024/06/27

Learn AI 不 BI

AI說書 - 從0開始 - 58

#AI#ai#PromptEngineering

2024/06/27

Learn AI 不 BI

AI說書 - 從0開始 - 57

#AI#ai#PromptEngineering

2024/06/27

Learn AI 不 BI

AI說書 - 從0開始 - 57

#AI#ai#PromptEngineering

2024/06/27

Learn AI 不 BI

AI說書 - 從0開始 - 56

#AI#ai#PromptEngineering

2024/06/27

Learn AI 不 BI

AI說書 - 從0開始 - 56

#AI#ai#PromptEngineering

2024/06/27

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News