示範 4090 訓練 LLM Tool-Calling 的 dataset 格式

2026/03/06 更新2026/03/06 發佈閱讀 9 分鐘

示範一個 RTX 4090 用於訓練 LLM「工具調用（Tool Calling）」的資料格式。這種格式比原本的 Python 範例更接近 OpenAI / Llama / DeepSeek / function calling dataset 常見結構。

我會分成三種常見版本：

1️⃣ 最簡單 instruction-tuning 格式

2️⃣ ChatML / 對話式訓練格式

3️⃣ 真正 production 級 tool-calling dataset

1️⃣ 最簡單 Instruction Tuning 格式（最常見）

這是 LoRA / SFT 微調最常見格式。

</>Python
training_data = {
    "instruction": "幫我查一下預算表，並在明天下午三點排個審核會。",
    "output": """{"tool": "query_database", "params": {"query": "budget_2026"}}
{"tool": "add_calendar_event", "params": {"title": "預算審核", "start_time": "tomorrow 15:00"}}"""
}

優點：

結構簡單
容易生成大量資料
適合 Llama / Qwen / Mistral 微調

缺點：

不是真正的多輪對話
模型不一定理解工具回傳

2️⃣ ChatML 對話格式（更接近 ChatGPT）

這是現在很多模型訓練的方式。

</>Python
training_data = {
    "messages": [
        {
            "role": "system",
            "content": "你是一位助理，可以使用工具 query_database 和 add_calendar_event。"
        },
        {
            "role": "user",
            "content": "幫我查一下預算表，並在明天下午三點排個審核會。"
        },
        {
            "role": "assistant",
            "content": None,
            "tool_calls": [
                {
                    "name": "query_database",
                    "arguments": {
                        "query": "budget_2026"
                    }
                },
                {
                    "name": "add_calendar_event",
                    "arguments": {
                        "title": "預算審核",
                        "start_time": "tomorrow 15:00"
                    }
                }
            ]
        }
    ]
}

這種格式：

OpenAI function calling
DeepSeek tool use
Llama3 tool calling

都很接近。

3️⃣ Production 級 Tool-Calling Dataset（完整流程）

真正好的訓練資料會包含：

1️⃣ 模型呼叫工具

2️⃣ 工具回傳結果

3️⃣ 模型再回答

例如：

</>Python
training_data = {
    "messages": [
        {
            "role": "system",
            "content": "你是一位助理，可以使用工具 query_database 和 add_calendar_event。"
        },
        {
            "role": "user",
            "content": "幫我查一下預算表。"
        },
        {
            "role": "assistant",
            "tool_calls": [
                {
                    "name": "query_database",
                    "arguments": {
                        "query": "budget_2026"
                    }
                }
            ]
        },
        {
            "role": "tool",
            "name": "query_database",
            "content": "budget_2026.xlsx"
        },
        {
            "role": "assistant",
            "content": "我已找到預算表：budget_2026.xlsx"
        }
    ]
}

這種資料能訓練模型：

什麼時候呼叫工具
如何解析回傳
如何繼續回答

4️⃣ 真正大型模型的 Dataset 長相

很多開源工具 dataset 長這樣（JSONL）：

{"messages":[...]}
{"messages":[...]}
{"messages":[...]}

例如：

dataset.jsonl

每一行一筆訓練資料。

例如：

{"messages":[{"role":"user","content":"查天氣"},{"role":"assistant","tool_calls":[...]}]}
{"messages":[{"role":"user","content":"查股票"},{"role":"assistant","tool_calls":[...]}]}

5️⃣ 如果你要訓練「武俠小說 AI」

其實可以設計一種 武俠 Tool Calling。

例如：

工具：

1. search_character
2. search_martial_art
3. search_dynasty

資料：

</>Python
{
 "instruction":"介紹安祿山",
 "output":{
   "tool":"search_character",
   "params":{"name":"安祿山"}
 }
}

模型就會學會：

遇到人物 → 查資料庫

6️⃣ 小模型（RTX4090）訓練建議

如果你用 4090 微調模型

建議：

Dataset量：

✅ 總結

原本 Python 範例：

語法 ✔️
但不是最佳 dataset 結構

更推薦：

messages
tool_calls
tool response
assistant reply

這是現在 LLM tool training 的主流格式。

留言

sirius數字沙龍

11會員

250內容數

吃自助火鍋啦！不要客氣，想吃啥，請自行取用！

sirius數字沙龍的其他內容

2026/03/06

Data Collator 函數呼叫範例討論

在之前「學會調用 Calendar API 或查詢數據庫」一文中，將 API 的定義定義在 System Prompt 中範例有如下討論。

2026/03/06

Data Collator 函數呼叫範例討論

在之前「學會調用 Calendar API 或查詢數據庫」一文中，將 API 的定義定義在 System Prompt 中範例有如下討論。

2026/03/06

寫一個 HTML 網頁介面，可以在瀏覽器中直接跟 5090 助理對話

這是一個簡單但功能強大的 HTML + Tailwind CSS 前端介面。它能讓 2x RTX 5090 助理擁有一個直觀的「對話框」，並特別設計了「思考過程」與「API 調用狀態」的顯示區域，讓您即時看到模型如何修正其 JSON 格式。 1. 建立前端檔案 index.html

2026/03/06

寫一個 HTML 網頁介面，可以在瀏覽器中直接跟 5090 助理對話

2026/03/06

把驗證邏輯封裝成一個簡單的 API 伺服器腳本

這是一個基於 FastAPI 的工業級實作。這套腳本能讓 2x RTX 5090 轉化為一個強大的後端推理中心，自動處理模型生成的 JSON，驗證其是否符合 API 規範，並在錯誤時自動進行「自我修正」嘗試。 1. 安裝必要套件在您的 conda 環境中執行： </>Bash pip ins

2026/03/06

把驗證邏輯封裝成一個簡單的 API 伺服器腳本

看更多

你可能也想看

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

《轉轉生》為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，融合舞蹈、音樂、時尚和視覺藝術，透過身體、服裝與群舞結構，回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發，分析《轉轉生》如何以當代目光，形塑去殖民視角的奈及利亞歷史。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14