AI說書 - 從0開始 - 234 | 微調 GPT 模型的資料集檢查

LearnAI

發佈於三分鐘學AI (2)

2024/11/01 更新2024/11/01 發佈閱讀 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

先列出目前擁有的材料：

微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言
微調 GPT 模型的前置步驟：AI說書 - 從0開始 - 230 | 微調 GPT 模型的前置步驟
微調 GPT 模型的函式庫安裝：AI說書 - 從0開始 - 231 | 微調 GPT 模型的函式庫安裝
微調 GPT 模型的資料集準備：AI說書 - 從0開始 - 232 | 微調 GPT 模型的資料集準備
微調 GPT 模型的資料集檢查：AI說書 - 從0開始 - 233 | 微調 GPT 模型的資料集檢查

接著系統會把 JSON 轉換成 JSONL 檔案：

此外 OpenAI 會出現以下提示：

可以透過以下程式偷看一下 JSONL 檔案的內容：

import json

with open('kant_prompts_and_completions_prepared.jsonl', 'r') as f:
	lines = f.readlines()

for line in lines[199:300]:
	data = json.loads(line)
	print(json.dumps(data, indent = 4))

結果為：

注意以下幾點：

Prompt 中的「->」
Completion 中的「開頭空格」以及「\n」

Learn AI 不 BI三分鐘學AI (2)AI從0開始-第八章

留言

留言分享你的想法！

Learn AI 不 BI

244會員

949內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2024/11/11

AI說書 - 從0開始 - 244 | 第八章額外閱讀項目

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 227 | 第八章引言到 AI說書 - 從0開始 - 243 | 微調 GPT 模型與 GPT4 比較，我們完成書籍：Transfor

2024/11/11

AI說書 - 從0開始 - 244 | 第八章額外閱讀項目

2024/11/10

AI說書 - 從0開始 - 243 | 微調 GPT 模型與 GPT4 比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

2024/11/10

AI說書 - 從0開始 - 243 | 微調 GPT 模型與 GPT4 比較

2024/11/09

AI說書 - 從0開始 - 242 | 微調 GPT 模型與 GPT4 比較

2024/11/09

AI說書 - 從0開始 - 242 | 微調 GPT 模型與 GPT4 比較

看更多

你可能也想看

黛•Adele的生活隨筆

Sunkronizo 的 Playful Heart 是一款帶著明亮果香與柔和木質調的甜感香水，特別適合星期四使用。前調活潑、尾韻沉靜，陪你從忙碌過渡到週末的輕鬆心情。適合喜歡果香、花果香調的女性，也很適合作為溫暖又有個性的送禮選擇。可於官網、Pinkoi 選購，11 月底起於臺中國家歌劇院寄售。

2025/11/25

2025/11/25

【編輯現場】當世界都想看台灣故事：VOD 串流如何引爆下一個「台流」？

根據美國電影協會（MPA）主辦的「串流服務如何推動臺灣創意經濟」論壇內容，深入探討串流平臺對臺灣影視產業的影響、數據分析、政府政策建議、內容國際化策略，以及臺灣與「韓流」的差距。文章提出 awwrated 在串流生態系中的潛在角色，強調數據、策略與自信是臺灣影視產業發展的關鍵。

#awwrated#Netflix#NETFLIX影集

2025/11/21

awwrated的沙龍

【編輯現場】當世界都想看台灣故事：VOD 串流如何引爆下一個「台流」？

#awwrated#Netflix#NETFLIX影集

2025/11/21