我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
回顧目前有的素材:
我們將透過以下步驟來使用 OpenAI 準備的 Embedded 資料:
透過以下程式載入 Embedding 數據:
embeddings_path = "https://cdn.openai.com/API/examples/data/winter_olympics_2022.csv"
df = pd.read_csv(embeddings_path)
再由 String 形式轉成 List 形式:
df['embedding'] = df['embedding'].apply(ast.literal_eval)
最後顯示一些數據來感受一下:
df
結果包含 text 與 embedding 兩個 Column: