我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
- 主題:使用資料集 CoLA,來學習如何判斷一個句子的文法是否是可以被接受的
- 衡量標準:採用 Matthews Correlation Coefficient (MCC),詳見 AI說書 - 從0開始 - 83
在接下來的操作,會需要使用到煩冗的程式運算,需要有 GPU 來支撐,使用 Google Colab 的 GPU 資源操作見 使用Meta釋出的模型,實作Chat GPT - Part 0