我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COPA) 任務,Transformer 必須選擇問題的最合理的答案,資料集提供了前提,Transformer 模型必須找到最合理的答案。
在 AI說書 - 從0開始 - 88 介紹了:
在 AI說書 - 從0開始 - 89 介紹了:
以下繼續介紹 Wang 等人 2019 年的論文所提出的其他任務:
圖片出自書籍:Transformers for Natural Language Processing and Computer Vision, 2024
Transformer 模型必須透過尋找字符位置的正確值來回答查詢:
圖片出自書籍:Transformers for Natural Language Processing and Computer Vision, 2024