我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。書籍:Transformers for Natural Language Processing and Computer Vision, Denis Rothman, 2024 第三章,將介紹以下內容:Transformer Attention 機制如何產生輸出用人的眼光與基準來衡量 Transformer 輸出衡量的工具基準任務與資料集的介紹使用 SST-2 進行情緒分析