我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。在 AI說書 - 從0開始 - 133 中,已經確立了目標就是要做 Fine-Tuning,那主題是什麼?衡量標準是什麼?以下說明:主題:使用資料集 CoLA,來學習如何判斷一個句子的文法是否是可以被接受的衡量標準:採用 Matthews Correlation Coefficient (MCC),詳見 AI說書 - 從0開始 - 83在接下來的操作,會需要使用到煩冗的程式運算,需要有 GPU 來支撐,使用 Google Colab 的 GPU 資源操作見 使用Meta釋出的模型,實作Chat GPT - Part 0