我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 80 ,ChatGPT 產生的程式,我們將它匯入 Colab 執行看看 ( Colab 使用教學見 使用Meta釋出的模型,實作Chat GPT - Part 0 ),得到以下結果 :圖片出自書籍:Transformers for Natural Language Processing and Computer Vision, Denis Rothman, 2024從這裡我們得到幾個結論 :自然語言模型訓練一個模型並觀察上下文來預測文字或以此文字推疊來形成句子自然語言理解 (NLU) 將模型融入人類語言的意圖和意義