AI說書 - 從0開始 - 18

閱讀時間約 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。


我們已經在AI說書 - 從0開始 - 17中,介紹了大型語言模型 (LLM)世界裡面常用到的Token,現在我們來談談OpenAI的GPT模型如何利用Inference的Pipeline產生Token:

資料出自書籍:Transformers for Natural Language Processing and Computer Vision, Denis Rothman, 2024.

資料出自書籍:Transformers for Natural Language Processing and Computer Vision, Denis Rothman, 2024.

  1. Tokenization:利用Tokenizer將Input Sequence轉成Tokens
  2. Model Input:Pipeline將已經被Tokenized的Sequence匯入訓練好的GPT Model
  3. Model:透過多層Layer來處理輸入資料,包含Input Layer、、Multiple Transformer Layers、Output Layer
  4. Output Generation:Input Sequence匯入Model後產生Raw Output Logits
  5. Sampler:將Logits轉成Probabilities
  6. Next Token Selection (Next TS):依據Sampler輸出的Probabilites來產生Next Token
  7. Next Token Addition:前一步驟的Selected Next Token和Input Sequence做串接,以此從步驟三開始重複執行,一直到Maximum Token Limit達到
  8. Token Generation Completion (Token Generation):滿足以下任意兩情況的話,Token Generation程序結束:
  • Maximum Token Limit達到
  • 偵測到End-of-Sequence Token
  1. Text Reconstruction:Tokenizer將最後的Token Sequence轉成字串,比較容易理解的話是:縫合Any subword tokens back together to form whole words
5會員
72內容數
這裡將提供: AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹,一起在未來AI的世界擁抱AI技術,不BI。同時分享各種網路賺錢方法,包含實測結果
留言0
查看全部
發表第一個留言支持創作者!
LearnAI的沙龍 的其他內容
AI說書 - 從0開始 - 14
閱讀時間約 1 分鐘
AI說書 - Prompt Engineering - 5
閱讀時間約 1 分鐘
AI說書 - Prompt Engineering - 6
閱讀時間約 1 分鐘
AI說書 - 從0開始 - 15
閱讀時間約 2 分鐘
AI說書 - 從0開始 - 16
閱讀時間約 3 分鐘
AI說書 - 從0開始 - 17
閱讀時間約 2 分鐘