AI說書 - 從0開始 - 42

LearnAI

發佈於三分鐘學AI

更新於 2024/06/23發佈於 2024/06/23閱讀時間約 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

在AI說書 - 從0開始 - 41中，我們提及 Transformer 的 Encoder 架構如下圖所示，同時我們羅列幾個要點於圖示右邊：

原始 Transformer 架構中設定 N = 6
因應 N = 6，因此 Multi-Head Attention也重複執行六次，這概念就像我們看一段文章，我們會同時追蹤這文章中多個字之間的關聯，英文原意就是：Explores Different Ways of Associating the Tokens in the Sequence
每個 Encoder Layer 內包含兩個 Sublayer ：Multi-Headed Attention Mechanism 與 Fully Connected Position-Wise Feedforward Network
原始 Transformer 架構中設定， Embedding Layer 、 Residual Connection 等 Sublayer 輸出維度均為 d_model= 512
維度設定一致可以避免運算設備還要做額外資源配置

接著我們來看看 Input Embedding Sublayer 做的是什麼事情，其架構如下：

其將 Input Tokens 轉換為維度為 512 的向量
而將 Input Sequence 轉換為 Input Tokens 的是 Tokenizer，它有很多種方法，如：Byte Pair Encoding 、 Word Piece 、 Sentence Piece 等等，原始 Transformer 使用的是 Byte Pair Encoding
舉一個例子來說明 Tokenizer 做的事情，假如我有一個句子為：「the Transformer is an innovative NLP model !」，那麼經過 Tokenizer 後將得到：'the' 、 'transform' 、 'er'、'is'、'an'、'innovative'、'n'、'l'、'p'、'model'、'!'

Learn AI 不 BI三分鐘學AIAI從0開始-第二章

Learn AI 不 BI

217會員

552內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言

留言分享你的想法！

Learn AI 不 BI 的其他內容

AI說書 - Prompt Engineering - 19

我們人類和ChatGPT的對話技巧也是需要學習的，有鑑於此，我想要一天分享一點「和ChatGPT對話的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。當我們從基礎 Prompt 過渡到進階 Prompt 時，我們開始釋放人工智慧的潛在潛力，這個階段被稱為

#AI #ai #PromptEngineering

AI說書 - Prompt Engineering - 18

我們人類和ChatGPT的對話技巧也是需要學習的，有鑑於此，我想要一天分享一點「和ChatGPT對話的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。基本層級的 Prompt ，通常稱為 Ad-Hoc Prompting ，構成了 Prompt Engi

#AI #ai #PromptEngineering

AI說書 - Prompt Engineering - 17

我們人類和ChatGPT的對話技巧也是需要學習的，有鑑於此，我想要一天分享一點「和ChatGPT對話的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Prompt Engineering 是塑造我們與人工智慧系統互動方式的關鍵實踐，本質上，它是製定請求或

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 41

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。繼AI說書 - 從0開始 - 39，我們陳述了 Transformer 的全貌，那 Transformer 的 Encoder 部分長怎樣呢，如下所示：在原始

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 40

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 中的 Attention 機制是 'Word-to-Word' 操作，抑或是 'Token-to-Token' 操作，白話來講就是：「對於句子中

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 39

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。首先先展示 Transformer 的架構圖：可以看到架構中不再出現 RNN 、 LSTM 、 CNN 等物件，因為 Recurrence 已被摒棄。

#AI #ai #PromptEngineering

AI說書 - Prompt Engineering - 19

#AI #ai #PromptEngineering

AI說書 - Prompt Engineering - 18

#AI #ai #PromptEngineering

AI說書 - Prompt Engineering - 17

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 41

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 40

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 39

#AI #ai #PromptEngineering

你可能也想看

Google News 追蹤

方格子 vocus 官方沙龍

2025/04/10

限時 9 折！精選投資理財沙龍推薦｜大盤動盪，知識進場

【vocus 精選投資理財/金融類沙龍，輸入 "moneyback" 年訂閱 9 折】市場動盪時，加碼永遠值得的投資標的——「自己」川普政府再度拋出關稅震撼彈，全球市場應聲重挫，從散戶到專業投資人，都急著找尋買進殺出的訊號，就是現在，輪到知識進場！把握時機讓自己升級，別放過反彈的機會！

#折扣碼 #方案 #投資

柔伊61 穿搭 . 美妝 . 分享生活

2025/04/01

提升氛圍感必不可少的單品！( mo店+ 、Bliss BKK )

就能get 同款韓系質感包👜 而且獨家下殺 299元up 讓它成為你的必備單品吧！ - momo優惠折扣碼領取超簡單❤️ 點擊右下角會員中心 - 折價券輸入 FLOWERMOMO 點擊歸戶就能領取商店優惠券啦！ - https://momo.dm/RaFNzR

#momo #穿搭 #時尚單品

姜廷蓉的沙龍

2025/04/01

mo店+ S999純銀四葉草項鍊：你的幸運守護神

momo店+ S999純銀四葉草項鍊，精緻細膩，代表愛情、希望、信念與幸運，是送給自己或別人的完美禮物。限時下殺299元起，超取免運！

#首飾 #項鍊 #穿搭

柴郡貓姍蒂的沙龍

2024/06/29

筆記-深度學習參數理解："input_shape"

前言在閱讀《強化式學習：打造最強 AlphaZero 通用演算法》時，對一些看似基本，但是重要且會影響到之後實作的項目概念有點疑惑，覺得應該查清楚，所以搞懂後記錄下來，寫下這篇文章(應該說是筆記？)。正文下面這段程式碼： model = Sequential() model.add

https://www.youtube.com/watch?v=wjZofJX0v4M 這是我看過最好的AI科普影片了；現在流行的GPT使用的大語言模型 (large language model, LLM), 是把每一個單字都當作一個高維度向量影片中GPT3共儲存50257個英文單字, 每

#AI #LLM #GPT

無限智慧學院的沙龍

2024/06/13

迎戰未來，AI 量子計算基礎篇 (1)，Single Systems

預計量子AI計算會在2032年左右來到，在這之前，我們還有充足的時間可以逐步去學習量子計算與演算法，讓我們按部就班，持續前進，做輕鬆無負擔的超前學習 !

#QuantumComputing #Qiskit #braket

貓貓學習筆記

2024/05/27

TextToSpeech-神經網路如何理解文字

上篇我們簡單的了解了 TTS 想要達到的目標，但是對於訓練資料的處理、網路架構、損失函數、輸出分析等考慮到篇幅尚未解釋清楚，這篇將針對訓練資料處理中的文字部分進行詳細說明，讓我們開始吧。

#AI #TextToSpeech #Pytorch

創作邦｜設計X工具X品牌的沙龍

2024/05/01

我如何從零開始接觸與學習 AI，超詳細學習方法與心得

AI 相關的內容每天都非常多，有聽過很多人因此感覺到焦慮，怕錯過了最新資訊就會趕不上，這篇內容會跟大家詳細的分享我自己的學習方法和經驗，並且會在最後分享一些我的學習資訊來源。

#AI #學習 #創作

王啟樺的沙龍

2024/04/27

LLM 005｜大語言模型是如何利用Transformer理解語言的？

現代大語言模型建構於Transformer結構。 Transformer結構是源自於2017年著名論文 Attention Is All You Need的深度神經網路結構。原始的Trasformer是為了機器翻譯發展，當初的任務是將英文翻譯成德文與法文。 Transformer

#大語言模型 #Transformer #ChatGPT

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

大語言模型能夠生成文本，因此被認為是生成式人工智慧的一種形式。人工智慧的學科任務，是製作機器，使其能執行需要人類智慧才能執行的任務，例如理解語言，便是模式，做出決策。除了大語言模型，人工智慧也包含了深度學習以及機器學習。機器學習的學科任務，是透過演算法來實踐AI。特別

#大語言模型 #ChatGPT #人工智慧

易樂的沙龍

2024/03/24

加油！以生成式AI 創建，各式各樣客製化精準學習AI BOT！

這篇文章介紹瞭如何利用生成式AI（GenAI）來提高學習效率，包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度，保持學術誠信，適當運用GenAI能大幅提升工作效率。

數位化時代中，人工智能（AI）已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性，並提出負責任地發展和使用AI的思考。

#挑戰 #人工智能 #責任

無限智慧學院的沙龍

2024/01/08

用一張圖片生成多視角3D，LRM by Hong et al.

Transformer被廣泛運用在各種生成式AI，激起了本篇作者的好奇心，是否能用Transformer學到所有先驗知識，足以讓它由一張2D圖片還原3D物件。本篇也從Github上面找到由ZexinHe開源的LRM實作程式，讓有興趣的人可以深入研究。

#openLRM #Transformer #ViT

方格子 vocus 官方沙龍

2025/04/10

限時 9 折！精選投資理財沙龍推薦｜大盤動盪，知識進場

#折扣碼 #方案 #投資

柔伊61 穿搭 . 美妝 . 分享生活

2025/04/01

提升氛圍感必不可少的單品！( mo店+ 、Bliss BKK )

#momo #穿搭 #時尚單品

姜廷蓉的沙龍

2025/04/01

mo店+ S999純銀四葉草項鍊：你的幸運守護神

momo店+ S999純銀四葉草項鍊，精緻細膩，代表愛情、希望、信念與幸運，是送給自己或別人的完美禮物。限時下殺299元起，超取免運！

#首飾 #項鍊 #穿搭

柴郡貓姍蒂的沙龍

2024/06/29

筆記-深度學習參數理解："input_shape"

迎戰未來，AI 量子計算基礎篇 (1)，Single Systems

#QuantumComputing #Qiskit #braket

貓貓學習筆記

2024/05/27

TextToSpeech-神經網路如何理解文字

#AI #TextToSpeech #Pytorch

創作邦｜設計X工具X品牌的沙龍

2024/05/01

我如何從零開始接觸與學習 AI，超詳細學習方法與心得

#AI #學習 #創作

王啟樺的沙龍

2024/04/27

LLM 005｜大語言模型是如何利用Transformer理解語言的？

#大語言模型 #Transformer #ChatGPT

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

#大語言模型 #ChatGPT #人工智慧

易樂的沙龍

2024/03/24

加油！以生成式AI 創建，各式各樣客製化精準學習AI BOT！

數位化時代中，人工智能（AI）已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性，並提出負責任地發展和使用AI的思考。

#挑戰 #人工智能 #責任

無限智慧學院的沙龍

2024/01/08

用一張圖片生成多視角3D，LRM by Hong et al.

#openLRM #Transformer #ViT