示範 4090 訓練 LLM Tool-Calling 的 dataset 格式

更新 發佈閱讀 9 分鐘

示範一個 RTX 4090 用於訓練 LLM「工具調用(Tool Calling)」的資料格式。這種格式比原本的 Python 範例更接近 OpenAI / Llama / DeepSeek / function calling dataset 常見結構。

我會分成三種常見版本:

1️⃣ 最簡單 instruction-tuning 格式

2️⃣ ChatML / 對話式訓練格式

3️⃣ 真正 production 級 tool-calling dataset


1️⃣ 最簡單 Instruction Tuning 格式(最常見)

這是 LoRA / SFT 微調最常見格式。

</>Python
training_data = {
"instruction": "幫我查一下預算表,並在明天下午三點排個審核會。",
"output": """{"tool": "query_database", "params": {"query": "budget_2026"}}
{"tool": "add_calendar_event", "params": {"title": "預算審核", "start_time": "tomorrow 15:00"}}"""
}

優點:

  • 結構簡單
  • 容易生成大量資料
  • 適合 Llama / Qwen / Mistral 微調

缺點:

  • 不是真正的多輪對話
  • 模型不一定理解工具回傳

2️⃣ ChatML 對話格式 (更接近 ChatGPT)

這是現在很多模型訓練的方式。

</>Python
training_data = {
"messages": [
{
"role": "system",
"content": "你是一位助理,可以使用工具 query_database 和 add_calendar_event。"
},
{
"role": "user",
"content": "幫我查一下預算表,並在明天下午三點排個審核會。"
},
{
"role": "assistant",
"content": None,
"tool_calls": [
{
"name": "query_database",
"arguments": {
"query": "budget_2026"
}
},
{
"name": "add_calendar_event",
"arguments": {
"title": "預算審核",
"start_time": "tomorrow 15:00"
}
}
]
}
]
}

這種格式:

  • OpenAI function calling
  • DeepSeek tool use
  • Llama3 tool calling

都很接近。


3️⃣ Production 級 Tool-Calling Dataset(完整流程)

真正好的訓練資料會包含:

1️⃣ 模型呼叫工具

2️⃣ 工具回傳結果

3️⃣ 模型再回答

例如:

</>Python
training_data = {
"messages": [
{
"role": "system",
"content": "你是一位助理,可以使用工具 query_database 和 add_calendar_event。"
},
{
"role": "user",
"content": "幫我查一下預算表。"
},
{
"role": "assistant",
"tool_calls": [
{
"name": "query_database",
"arguments": {
"query": "budget_2026"
}
}
]
},
{
"role": "tool",
"name": "query_database",
"content": "budget_2026.xlsx"
},
{
"role": "assistant",
"content": "我已找到預算表:budget_2026.xlsx"
}
]
}

這種資料能訓練模型:

  • 什麼時候呼叫工具
  • 如何解析回傳
  • 如何繼續回答

4️⃣ 真正大型模型的 Dataset 長相

很多開源工具 dataset 長這樣(JSONL):

{"messages":[...]}
{"messages":[...]}
{"messages":[...]}

例如:

dataset.jsonl

每一行一筆訓練資料。

例如:

{"messages":[{"role":"user","content":"查天氣"},{"role":"assistant","tool_calls":[...]}]}
{"messages":[{"role":"user","content":"查股票"},{"role":"assistant","tool_calls":[...]}]}

5️⃣ 如果你要訓練「武俠小說 AI」

其實可以設計一種 武俠 Tool Calling

例如:

工具:

1. search_character
2. search_martial_art
3. search_dynasty

資料:

</>Python
{
"instruction":"介紹安祿山",
"output":{
"tool":"search_character",
"params":{"name":"安祿山"}
}
}

模型就會學會:

遇到人物 → 查資料庫


6️⃣ 小模型(RTX4090)訓練建議

如果你用 4090 微調模型

建議:

raw-image

Dataset量:

raw-image

總結

原本 Python 範例:

  • 語法 ✔️
  • 但不是最佳 dataset 結構

更推薦:

messages
tool_calls
tool response
assistant reply

這是現在 LLM tool training 的主流格式


留言
avatar-img
sirius數字沙龍
11會員
250內容數
吃自助火鍋啦!不要客氣,想吃啥,請自行取用!
sirius數字沙龍的其他內容
2026/03/06
在之前「學會調用 Calendar API 或查詢數據庫」一文中,將 API 的定義定義在 System Prompt 中範例有如下討論。
Thumbnail
2026/03/06
在之前「學會調用 Calendar API 或查詢數據庫」一文中,將 API 的定義定義在 System Prompt 中範例有如下討論。
Thumbnail
2026/03/06
這是一個簡單但功能強大的 HTML + Tailwind CSS 前端介面。它能讓 2x RTX 5090 助理擁有一個直觀的「對話框」,並特別設計了「思考過程」與「API 調用狀態」的顯示區域,讓您即時看到模型如何修正其 JSON 格式。 1. 建立前端檔案 index.html
Thumbnail
2026/03/06
這是一個簡單但功能強大的 HTML + Tailwind CSS 前端介面。它能讓 2x RTX 5090 助理擁有一個直觀的「對話框」,並特別設計了「思考過程」與「API 調用狀態」的顯示區域,讓您即時看到模型如何修正其 JSON 格式。 1. 建立前端檔案 index.html
Thumbnail
2026/03/06
這是一個基於 FastAPI 的工業級實作。這套腳本能讓 2x RTX 5090 轉化為一個強大的後端推理中心,自動處理模型生成的 JSON,驗證其是否符合 API 規範,並在錯誤時自動進行「自我修正」嘗試。 1. 安裝必要套件 在您的 conda 環境中執行: </>Bash pip ins
Thumbnail
2026/03/06
這是一個基於 FastAPI 的工業級實作。這套腳本能讓 2x RTX 5090 轉化為一個強大的後端推理中心,自動處理模型生成的 JSON,驗證其是否符合 API 規範,並在錯誤時自動進行「自我修正」嘗試。 1. 安裝必要套件 在您的 conda 環境中執行: </>Bash pip ins
Thumbnail
看更多
你可能也想看
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
事務辦公室(UNODA)聯手推動的創新機制,不再只是傳統意義上的物資援助,而是一場關於社會韌性與「以人為本」正義體系的深刻實驗。透過這份 2025 年 9 月發布的最新評估,我們能看見一個充滿慈悲與智慧的轉折點:原來,當制度開始傾聽生命的重量,和平便有了根基。
Thumbnail
事務辦公室(UNODA)聯手推動的創新機制,不再只是傳統意義上的物資援助,而是一場關於社會韌性與「以人為本」正義體系的深刻實驗。透過這份 2025 年 9 月發布的最新評估,我們能看見一個充滿慈悲與智慧的轉折點:原來,當制度開始傾聽生命的重量,和平便有了根基。
Thumbnail
大家好,這裡是阿吉讀書心得。 用書本整理思緒,用生活驗證想法。 分享閱讀帶來的改變與日常觀察。 將讀書心得的想法 製作成課程 在頻道裡直接上 覺得有幫助的人 可以到pressplay 搜尋阿吉「腦力與身心能量」課程 成為訂閱會員 第 5 課:時間軸漂浮術 ⏳ 第五節:時
Thumbnail
大家好,這裡是阿吉讀書心得。 用書本整理思緒,用生活驗證想法。 分享閱讀帶來的改變與日常觀察。 將讀書心得的想法 製作成課程 在頻道裡直接上 覺得有幫助的人 可以到pressplay 搜尋阿吉「腦力與身心能量」課程 成為訂閱會員 第 5 課:時間軸漂浮術 ⏳ 第五節:時
Thumbnail
這是一封給疲憊靈魂的溫柔信箋。透過2025年聯合國SDG數據,我們不僅看見世界的貧富裂痕,更看見各大宗教慈悲的解方。從佛陀的布施、耶穌的禧年到孔孟的大同,願我們在數據的荒原中,找回彼此相愛的勇氣,將冰冷的經濟數字轉化為愛的流動,共同療癒這顆受傷的地球,建立人間淨土。
Thumbnail
這是一封給疲憊靈魂的溫柔信箋。透過2025年聯合國SDG數據,我們不僅看見世界的貧富裂痕,更看見各大宗教慈悲的解方。從佛陀的布施、耶穌的禧年到孔孟的大同,願我們在數據的荒原中,找回彼此相愛的勇氣,將冰冷的經濟數字轉化為愛的流動,共同療癒這顆受傷的地球,建立人間淨土。
Thumbnail
這是一篇以「水」為喻的靈性導讀。透過四個寓言:身體的低燒(地球水壓力與知足智慧)、家庭的汙水池(廢水處理與共業淨化)、城市的交通壅塞(跨界河流合作與Ubuntu精神)、家園的枯萎根基(用水尊嚴與生態守護),將聯合國水資源報告轉化為對身心、社群與環境的慈悲觀照,引領讀者成為希望的源頭。
Thumbnail
這是一篇以「水」為喻的靈性導讀。透過四個寓言:身體的低燒(地球水壓力與知足智慧)、家庭的汙水池(廢水處理與共業淨化)、城市的交通壅塞(跨界河流合作與Ubuntu精神)、家園的枯萎根基(用水尊嚴與生態守護),將聯合國水資源報告轉化為對身心、社群與環境的慈悲觀照,引領讀者成為希望的源頭。
Thumbnail
這是一篇以「水」為喻的靈性導讀。透過四個寓言:身體的低燒(地球水壓力與知足智慧)、家庭的汙水池(廢水處理與共業淨化)、城市的交通壅塞(跨界河流合作與Ubuntu精神)、家園的枯萎根基(用水尊嚴與生態守護),將聯合國水資源報告轉化為對身心、社群與環境的慈悲觀照,引領讀者成為希望的源頭。
Thumbnail
這是一篇以「水」為喻的靈性導讀。透過四個寓言:身體的低燒(地球水壓力與知足智慧)、家庭的汙水池(廢水處理與共業淨化)、城市的交通壅塞(跨界河流合作與Ubuntu精神)、家園的枯萎根基(用水尊嚴與生態守護),將聯合國水資源報告轉化為對身心、社群與環境的慈悲觀照,引領讀者成為希望的源頭。
Thumbnail
這是一篇以中醫與靈性視角解讀聯合國經濟報告的心靈導讀。將地球視為「法身」,診斷出碳排放如「痰濁阻肺」,製造業停滯如「脾虛濕阻」。揭示數位鴻溝是慈悲的考驗,信貸不足是信任危機,性別失衡是陰陽不調。引導讀者從冰冷數據中看見人性,選擇以關懷共建美好家園。
Thumbnail
這是一篇以中醫與靈性視角解讀聯合國經濟報告的心靈導讀。將地球視為「法身」,診斷出碳排放如「痰濁阻肺」,製造業停滯如「脾虛濕阻」。揭示數位鴻溝是慈悲的考驗,信貸不足是信任危機,性別失衡是陰陽不調。引導讀者從冰冷數據中看見人性,選擇以關懷共建美好家園。
Thumbnail
這是一篇對聯合國水資源報告的靈性解讀。揭示五大真相:廢水未經處理映照內心共業;效率提升反致資源消耗源於慾望膨脹;跨境河流治理反映合作困境;工業污染數據缺失顯示集體盲視;淡水物種銳減是靈性家園的荒蕪。引導讀者從「知足」、「正念」與「萬物一體」的視角,重塑與水的關係,修復大地與心靈。
Thumbnail
這是一篇對聯合國水資源報告的靈性解讀。揭示五大真相:廢水未經處理映照內心共業;效率提升反致資源消耗源於慾望膨脹;跨境河流治理反映合作困境;工業污染數據缺失顯示集體盲視;淡水物種銳減是靈性家園的荒蕪。引導讀者從「知足」、「正念」與「萬物一體」的視角,重塑與水的關係,修復大地與心靈。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News