我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
先列出目前擁有的材料:
既然資料集準備好了,我們來進行檢查一下:
import pandas as pd
df = pd.read_json('kant_prompts_and_completions.json', lines = True)
df
得到的結果為:
接著執行微調工具:
openai tools fine_tunes.prepare_data -f "kant_prompts_and_completions.json"
結果為: