學會調用 Calendar API 或查詢數據庫

2026/03/06 更新2026/03/06 發佈閱讀 5 分鐘

這是一個非常關鍵的進階需求。要讓模型成為能調用 Calendar API 或 數據庫 的「行動派助理」，這已經超出了單純的說話風格微調，進入了 Function Calling（函數調用） 或 Agent（智能體） 的範疇。

在兩張 RTX 5090 上，這需要特殊的數據格式與訓練策略。以下是您的配置優先級與實作建議：

1. 核心技術優先級 (Priority Ranking)

第一優先：特定格式的 SFT (數據格式化)

理由： 模型必須學會「在什麼時候停止說話，並輸出一串代碼」。這通常需要特定的符號（如 <|call|> 或 json 塊）。
建議： 數據集必須包含：User Query -> Thought (思考過程) -> Call (調用函數) -> Response (API 回傳結果) -> Final Answer。

第二優先：LoRA ($R=32 \sim 64$)

理由： 函數調用需要極高的精確度（括號不能錯、參數名稱要對）。R=8 太小，容易出錯；R=32 或 64 能讓模型更精準地記住 API 的參數結構。

第三優先：Flash Attention 3 (必開)

理由： 函數調用通常涉及很長的「系統提示詞（System Prompt）」，因為你需要把 API 的定義（如 add_event(date, title)）塞進 Prompt 裡。這會佔用大量 Context，5090 的 Flash Attention 能確保推論不卡頓。

2. 數據集的結構化設計

對於「工具調用型」助理，數據必須包含以下三種場景：

直接調用： 「幫我訂明天下午兩點的會議。」 -> 輸出 call_calendar_api(...)。
澄清需求： 「幫我訂會議。」 -> 輸出「請問是哪一天的會議？」 (不要瞎猜)。
多步驟處理： 「查一下我明天的空檔，然後訂一個午餐會議。」 -> 先 query_db，再 add_event。

3. 2x 5090 專用的訓練設定

為了讓助理在調用 API 時「不手抖」（不寫錯字），請調整以下參數：

Weight Decay (權重衰減): 設為 0.1。這能防止模型對特定的日期過擬合，讓它學會通用的 API 語法。
Temperature (溫度): 訓練時不變，但推論時建議設為 0.1 或 0。對於 API 調用，我們需要確定性，不需要創意。
Batch Size: 推薦全局 Batch Size 設為 64。

4. 實作代碼範例：Data Collator 處理 Function Calling

您需要將 API 的定義定義在 System Prompt 中，例如：

</>Python
SYSTEM_PROMPT = """你是一位專業助理。你可以使用以下工具：
1. query_database(query_str): 查詢數據庫。
2. add_calendar_event(title, start_time): 新增行事曆。
如果需要使用工具，請輸出 JSON 格式：{"tool": "...", "params": {...}}"""

# 訓練數據範例
training_example = {
    "instruction": "幫我查一下預算表，並在明天下午三點排個審核會。",
    "output": '{"tool": "query_database", "params": {"query": "budget_2026"}}\n'
              '{"tool": "add_calendar_event", "params": {"title": "預算審核", "start_time": "2026-03-04T15:00"}}'
}

✔️以上實作代碼範例，後續使用 RTX 4090 訓練時，會再詳論

5. 5090 雙卡環境的優勢：並行測試 (Auto-Evaluation)

既然有兩張 5090，你可以啟動一個自動化測試流程：

卡 1 (Training)： 繼續微調模型。
卡 2 (Validation)： 每隔 100 個 Step 就抓出最新的 Checkpoint，嘗試調用一個模擬的 Calendar API。
監控指標： 統計 JSON 格式錯誤率 與 參數正確率。一旦這兩個指標達到 95% 以上，即可停止訓練。

最後的關鍵提醒

處理外部工具時，模型最容易犯的錯是 「幻覺調用」（調用一個不存在的函數）。

留言

sirius數字沙龍

9會員

218內容數

吃自助火鍋啦！不要客氣，想吃啥，請自行取用！

sirius數字沙龍的其他內容

2026/03/06

風格微調任務想要模型扮演「專業助理」的角色

目前的風格微調任務，想要模型扮演某個特定的角色，如專業助理，或要讓它符合特定格式，例如只用 Markdown 回覆，將決定我們是否要加入額外的格式約束代碼。要將模型訓練成一位「專業助理」，核心目標是提升模型的指令遵循能力（Instruction Following）、語氣穩定性以及任務執行邏輯。

2026/03/06

風格微調任務想要模型扮演「專業助理」的角色

2026/03/06

微調 (Fine-tuning)模型偏向「改變模型的說話風格」（指令遵循）

當任務從「注入知識」轉向「改變說話風格（Style Transfer）」或「指令遵循（Instruction Following）」時，微調的重點會從「修改深度權重」變為「學習對話模式」。在兩張 RTX 5090 的架構下，針對風格微調的配置優先級與專業建議如下。

2026/03/06

微調 (Fine-tuning)模型偏向「改變模型的說話風格」（指令遵循）

2026/03/06

自動監控、訓練結束後發送通知 Line的簡單腳本

這是一個非常實用的功能。在兩張 RTX 5090 上進行長達十幾小時的訓練時，你不需要一直盯著螢幕。我們可以利用 Line Notify（最簡單的 API）來實現這個功能。第一步：取得 Line Notify Token 前往 Line Notify 官方網站並登入。

2026/03/06

自動監控、訓練結束後發送通知 Line的簡單腳本

看更多

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品，以十段寓言式殘篇，重新拼貼記憶、暴力與美學，並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇：帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略，嘗試解析極權底下不可言說之事，將如何成為可被觀看的公共發聲。

#釀電影#釀評論#藝術評論

2026/01/14

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

#釀電影#釀評論#藝術評論

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

柏林劇團在 2026 北藝嚴選，再次帶來由布萊希特改編的經典劇目《三便士歌劇》（The Threepenny Opera），導演巴里・柯斯基以舞台結構與舞台調度，重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核，藉由沉浸與疏離的辯證，解析此作如何再次照見觀眾自身的位置。

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲．蓋柏樂》的詮釋，從劇本歷史、聲響與舞臺設計，到演員的主體創作方法，探討此版本如何讓經典劇作在當代劇場語境下煥發新生，滿足現代觀眾的觀看慾望。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

《轉轉生》為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，融合舞蹈、音樂、時尚和視覺藝術，透過身體、服裝與群舞結構，回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發，分析《轉轉生》如何以當代目光，形塑去殖民視角的奈及利亞歷史。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

Nashi的人資小九九

我的腦力外包計畫：如何從 0 到 1 打造不自作主張的個人助理「蝦瞎貓」

作者分享如何利用AI Agent打造個人助理「蝦瞎貓」，並將其深度整合至日常工作流程。文章強調了AI作為「轉譯者」而非「決策者」的重要性，以及如何透過結構化資料管理與Skill機制，建立一個可信賴、可持續演化的AI工作系統。作者也分享了實踐過程中遇到的挑戰與解決方案，並提供了Skill供讀者交流。

#AI代理#AI#OpenClaw

2026/03/04

Nashi的人資小九九

我的腦力外包計畫：如何從 0 到 1 打造不自作主張的個人助理「蝦瞎貓」

#AI代理#AI#OpenClaw

2026/03/04

Mech muse 智慧新知

🚀 Oracle 推出 AI Database 26ai：資料庫 × AI 的時代正式來臨！

Oracle 在 2025/10/14 發佈 AI Database 26ai，把向量搜尋、AI 治理和開放格式（Iceberg、ONNX、MCP）原生化到資料庫核心，並提供從 23ai「無痛升級」的路徑。本文用時間線與應用案例帶你快速掌握這場轉折。

#科技#AI#企業

2025/10/15

Mech muse 智慧新知

🚀 Oracle 推出 AI Database 26ai：資料庫 × AI 的時代正式來臨！

#科技#AI#企業

2025/10/15

月光下的許願池

151-- GenSpark是什麼？一站式AI助理讓工作更省力！

GenSpark是一款多功能AI助手，結合資料整合、內容生成與智慧分析，專注提升工作效率。具備快速閱讀資料、生成內容、雙語支援等優勢，適合需要快速處理資訊與產出內容的用戶。

#聊天機器人#GenSpark#AI

2025/04/10

月光下的許願池

151-- GenSpark是什麼？一站式AI助理讓工作更省力！

#聊天機器人#GenSpark#AI

2025/04/10

永續淨零這路，永續精靈伴你行！

【探碳大小事】03-國內外淨零政策好複雜？！企業面對氣候變遷會有哪些對策與淨零路徑？

透過國際因應氣候治理的對策，企業面臨國內外氣候變遷議題需執行對策。本文探討國際因應氣候治理的對策以及企業的淨零路徑規劃，對於氣候變遷盤查與因應策略提供多方面建議。

#溫室氣體#企業#淨零排放

2024/05/21

永續淨零這路，永續精靈伴你行！

【探碳大小事】03-國內外淨零政策好複雜？！企業面對氣候變遷會有哪些對策與淨零路徑？

#溫室氣體#企業#淨零排放

2024/05/21

股海中的追夢人

ESG分數在投資中越來越重要，怎麼查詢公司的ESG評分?

ESG評等對投資愈發重要，許多國際評等機構推出ESG評分機制，然而取得這些報告並不容易。透過臺灣集保中心的『ESG IR平臺』，投資人可以方便查詢國際及國內評分機構對臺灣上市櫃公司的評分。ESG評分雖非投資保證，但有助於判斷公司的可持續性和投資風險

#ESG#查詢#公司治理評鑑

2024/01/13

股海中的追夢人

ESG分數在投資中越來越重要，怎麼查詢公司的ESG評分?

#ESG#查詢#公司治理評鑑

2024/01/13

威利財經生活隨筆的沙龍

查詢債券00937B的基本方式

最近00937B很紅，搭上降息話題，很多朋友想了解這檔債券ETF的基本資料，又不知道哪裡找，這裡介紹使用MoneyDJ查詢ETF的基本資料可在首頁->ETF介紹->基本資料，舉例查詢00937B 群益ESG投等債20+。在基本資料下拉選單選擇群益投信->群益ESG投等債20+，如此

2023/12/20

2023/12/20

[C#] 使用參數化查詢進行安全的SQL資料存取

參數化查詢是一種將參數值傳遞給SQL語句的技術，這些參數值不會被直接解釋為SQL語法。這樣可以防止惡意用戶通過在輸入中插入惡意的SQL語法來攻擊資料庫。參數化查詢的一個主要優點是它能夠提高安全性，同時也能夠幫助資料庫優化查詢。

#查詢#程式#資料庫

2023/08/10

程式輕鬆玩

[C#] 使用參數化查詢進行安全的SQL資料存取

#查詢#程式#資料庫

2023/08/10

威利財經生活隨筆的沙龍

查詢債券ETF基本資料的方式

這邊介紹使用MoneyDJ查詢ETF的基本資料，可以再首頁->ETF介紹->基本資料，舉例查詢00679B 元大美國政府20年期(以上)債券基金。MoneyDJ網站推廣(MoneyDJ是威利財經角的合作夥伴): 在基本資料下拉選單選擇元大投信->元大美國政府20年期(以上)債券基金，如此可以查詢到E

2022/11/22

2022/11/22

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News