我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
- 微調 GPT 模型引言:AI說書 - 從0開始 - 229 | 微調 GPT 模型引言
- 微調 GPT 模型的前置步驟:AI說書 - 從0開始 - 230 | 微調 GPT 模型的前置步驟
- 微調 GPT 模型的函式庫安裝:AI說書 - 從0開始 - 231 | 微調 GPT 模型的函式庫安裝
- 微調 GPT 模型的資料集準備:AI說書 - 從0開始 - 232 | 微調 GPT 模型的資料集準備
既然資料集準備好了,我們來進行檢查一下:
import pandas as pd
df = pd.read_json('kant_prompts_and_completions.json', lines = True)
df
得到的結果為:

接著執行微調工具:
openai tools fine_tunes.prepare_data -f "kant_prompts_and_completions.json"
結果為:
