AI說書 - 從0開始 - 233 | 微調 GPT 模型的資料集檢查

2024/10/31 更新2024/10/31 發佈閱讀 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

先列出目前擁有的材料：

微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言
微調 GPT 模型的前置步驟：AI說書 - 從0開始 - 230 | 微調 GPT 模型的前置步驟
微調 GPT 模型的函式庫安裝：AI說書 - 從0開始 - 231 | 微調 GPT 模型的函式庫安裝
微調 GPT 模型的資料集準備：AI說書 - 從0開始 - 232 | 微調 GPT 模型的資料集準備

既然資料集準備好了，我們來進行檢查一下：

import pandas as pd

df = pd.read_json('kant_prompts_and_completions.json', lines = True) 
df

得到的結果為：

接著執行微調工具：

openai tools fine_tunes.prepare_data -f "kant_prompts_and_completions.json"

結果為：

Learn AI 不 BI三分鐘學AI (2)AI從0開始-第八章

留言

Learn AI 不 BI

249會員

1.2K內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2024/11/11

AI說書 - 從0開始 - 244 | 第八章額外閱讀項目

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 227 | 第八章引言到 AI說書 - 從0開始 - 243 | 微調 GPT 模型與 GPT4 比較，我們完成書籍：Transfor

2024/11/11

AI說書 - 從0開始 - 244 | 第八章額外閱讀項目

2024/11/10

AI說書 - 從0開始 - 243 | 微調 GPT 模型與 GPT4 比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

2024/11/10

AI說書 - 從0開始 - 243 | 微調 GPT 模型與 GPT4 比較

2024/11/09

AI說書 - 從0開始 - 242 | 微調 GPT 模型與 GPT4 比較

2024/11/09

AI說書 - 從0開始 - 242 | 微調 GPT 模型與 GPT4 比較

看更多

你可能也想看

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11