我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
ChatGPT 模型令人印象深刻,已經讓所有人感到驚訝,然而,ChatGPT 有記憶問題!它只記得從訓練數據中學到的東西,例如,2024 年 1 月時,ChatGPT 的知識截止日期為 2023 年 4 月,它無法回答有關 2023 年 4 月之後事件的問題,OpenAI 已經透過 BING 搜索引擎找到了某些問題的解決辦法,但這仍然不夠,為此,本章將闡述以下兩方法:
Prompt Design 和 Prompt Engineering 是兩個看似相似的術語,但它們將帶您進入新的水平:
我們先安裝一些必要依賴,方便後續使用:
!pip install --upgrade nltk -qq
import nltk
nltk.download('punkt') # Use punkt Sequence Tokenizer
!pip install gensim -qq
import gensim