學會調用 Calendar API 或查詢數據庫

更新 發佈閱讀 5 分鐘

這是一個非常關鍵的進階需求。要讓模型成為能調用 Calendar API數據庫 的「行動派助理」,這已經超出了單純的說話風格微調,進入了 Function Calling(函數調用)Agent(智能體) 的範疇。

在兩張 RTX 5090 上,這需要特殊的數據格式與訓練策略。以下是您的配置優先級與實作建議:


1. 核心技術優先級 (Priority Ranking)

第一優先:特定格式的 SFT (數據格式化)



  • 理由: 模型必須學會「在什麼時候停止說話,並輸出一串代碼」。這通常需要特定的符號(如 <|call|>json 塊)。
  • 建議: 數據集必須包含:User Query -> Thought (思考過程) -> Call (調用函數) -> Response (API 回傳結果) -> Final Answer

第二優先:LoRA ($R=32 \sim 64$)

  • 理由: 函數調用需要極高的精確度(括號不能錯、參數名稱要對)。R=8 太小,容易出錯;R=3264 能讓模型更精準地記住 API 的參數結構。

第三優先:Flash Attention 3 (必開)

  • 理由: 函數調用通常涉及很長的「系統提示詞(System Prompt)」,因為你需要把 API 的定義(如 add_event(date, title))塞進 Prompt 裡。這會佔用大量 Context,5090 的 Flash Attention 能確保推論不卡頓。

2. 數據集的結構化設計

對於「工具調用型」助理,數據必須包含以下三種場景:

  1. 直接調用: 「幫我訂明天下午兩點的會議。」 -> 輸出 call_calendar_api(...)
  2. 澄清需求: 「幫我訂會議。」 -> 輸出 「請問是哪一天的會議?」 (不要瞎猜)。
  3. 多步驟處理: 「查一下我明天的空檔,然後訂一個午餐會議。」 -> 先 query_db,再 add_event

3. 2x 5090 專用的訓練設定

為了讓助理在調用 API 時「不手抖」(不寫錯字),請調整以下參數:

  • Weight Decay (權重衰減): 設為 0.1。這能防止模型對特定的日期過擬合,讓它學會通用的 API 語法。
  • Temperature (溫度): 訓練時不變,但推論時建議設為 0.1 或 0。對於 API 調用,我們需要確定性,不需要創意。
  • Batch Size: 推薦全局 Batch Size 設為 64

4. 實作代碼範例:Data Collator 處理 Function Calling

您需要將 API 的定義定義在 System Prompt 中,例如:

</>Python
SYSTEM_PROMPT = """你是一位專業助理。你可以使用以下工具:
1. query_database(query_str): 查詢數據庫。
2. add_calendar_event(title, start_time): 新增行事曆。
如果需要使用工具,請輸出 JSON 格式:{"tool": "...", "params": {...}}"""

# 訓練數據範例
training_example = {
"instruction": "幫我查一下預算表,並在明天下午三點排個審核會。",
"output": '{"tool": "query_database", "params": {"query": "budget_2026"}}\n'
'{"tool": "add_calendar_event", "params": {"title": "預算審核", "start_time": "2026-03-04T15:00"}}'
}

✔️以上實作代碼範例,後續使用 RTX 4090 訓練時,會再詳論


5. 5090 雙卡環境的優勢:並行測試 (Auto-Evaluation)

既然有兩張 5090,你可以啟動一個自動化測試流程:

  • 卡 1 (Training): 繼續微調模型。
  • 卡 2 (Validation): 每隔 100 個 Step 就抓出最新的 Checkpoint,嘗試調用一個模擬的 Calendar API。
  • 監控指標: 統計 JSON 格式錯誤率參數正確率。一旦這兩個指標達到 95% 以上,即可停止訓練。

最後的關鍵提醒

處理外部工具時,模型最容易犯的錯是 「幻覺調用」(調用一個不存在的函數)。



留言
avatar-img
sirius數字沙龍
9會員
218內容數
吃自助火鍋啦!不要客氣,想吃啥,請自行取用!
sirius數字沙龍的其他內容
2026/03/06
目前的風格微調任務,想要模型扮演某個特定的角色,如專業助理,或要讓它符合特定格式,例如只用 Markdown 回覆,將決定我們是否要加入額外的格式約束代碼。 要將模型訓練成一位「專業助理」,核心目標是提升模型的指令遵循能力(Instruction Following)、語氣穩定性以及任務執行邏輯。
Thumbnail
2026/03/06
目前的風格微調任務,想要模型扮演某個特定的角色,如專業助理,或要讓它符合特定格式,例如只用 Markdown 回覆,將決定我們是否要加入額外的格式約束代碼。 要將模型訓練成一位「專業助理」,核心目標是提升模型的指令遵循能力(Instruction Following)、語氣穩定性以及任務執行邏輯。
Thumbnail
2026/03/06
當任務從「注入知識」轉向「改變說話風格(Style Transfer)」或「指令遵循(Instruction Following)」時,微調的重點會從「修改深度權重」變為「學習對話模式」。 在兩張 RTX 5090 的架構下,針對風格微調的配置優先級與專業建議如下。
Thumbnail
2026/03/06
當任務從「注入知識」轉向「改變說話風格(Style Transfer)」或「指令遵循(Instruction Following)」時,微調的重點會從「修改深度權重」變為「學習對話模式」。 在兩張 RTX 5090 的架構下,針對風格微調的配置優先級與專業建議如下。
Thumbnail
2026/03/06
這是一個非常實用的功能。在兩張 RTX 5090 上進行長達十幾小時的訓練時,你不需要一直盯著螢幕。我們可以利用 Line Notify(最簡單的 API)來實現這個功能。 第一步:取得 Line Notify Token 前往 Line Notify 官方網站 並登入。
Thumbnail
2026/03/06
這是一個非常實用的功能。在兩張 RTX 5090 上進行長達十幾小時的訓練時,你不需要一直盯著螢幕。我們可以利用 Line Notify(最簡單的 API)來實現這個功能。 第一步:取得 Line Notify Token 前往 Line Notify 官方網站 並登入。
Thumbnail
看更多
你可能也想看
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
作者分享如何利用AI Agent打造個人助理「蝦瞎貓」,並將其深度整合至日常工作流程。文章強調了AI作為「轉譯者」而非「決策者」的重要性,以及如何透過結構化資料管理與Skill機制,建立一個可信賴、可持續演化的AI工作系統。作者也分享了實踐過程中遇到的挑戰與解決方案,並提供了Skill供讀者交流。
Thumbnail
作者分享如何利用AI Agent打造個人助理「蝦瞎貓」,並將其深度整合至日常工作流程。文章強調了AI作為「轉譯者」而非「決策者」的重要性,以及如何透過結構化資料管理與Skill機制,建立一個可信賴、可持續演化的AI工作系統。作者也分享了實踐過程中遇到的挑戰與解決方案,並提供了Skill供讀者交流。
Thumbnail
Oracle 在 2025/10/14 發佈 AI Database 26ai,把向量搜尋、AI 治理和開放格式(Iceberg、ONNX、MCP)原生化到資料庫核心,並提供從 23ai「無痛升級」的路徑。本文用時間線與應用案例帶你快速掌握這場轉折。
Thumbnail
Oracle 在 2025/10/14 發佈 AI Database 26ai,把向量搜尋、AI 治理和開放格式(Iceberg、ONNX、MCP)原生化到資料庫核心,並提供從 23ai「無痛升級」的路徑。本文用時間線與應用案例帶你快速掌握這場轉折。
Thumbnail
GenSpark是一款多功能AI助手,結合資料整合、內容生成與智慧分析,專注提升工作效率。具備快速閱讀資料、生成內容、雙語支援等優勢,適合需要快速處理資訊與產出內容的用戶。
Thumbnail
GenSpark是一款多功能AI助手,結合資料整合、內容生成與智慧分析,專注提升工作效率。具備快速閱讀資料、生成內容、雙語支援等優勢,適合需要快速處理資訊與產出內容的用戶。
Thumbnail
透過國際因應氣候治理的對策,企業面臨國內外氣候變遷議題需執行對策。本文探討國際因應氣候治理的對策以及企業的淨零路徑規劃,對於氣候變遷盤查與因應策略提供多方面建議。
Thumbnail
透過國際因應氣候治理的對策,企業面臨國內外氣候變遷議題需執行對策。本文探討國際因應氣候治理的對策以及企業的淨零路徑規劃,對於氣候變遷盤查與因應策略提供多方面建議。
Thumbnail
ESG評等對投資愈發重要,許多國際評等機構推出ESG評分機制,然而取得這些報告並不容易。透過臺灣集保中心的『ESG IR平臺』,投資人可以方便查詢國際及國內評分機構對臺灣上市櫃公司的評分。ESG評分雖非投資保證,但有助於判斷公司的可持續性和投資風險
Thumbnail
ESG評等對投資愈發重要,許多國際評等機構推出ESG評分機制,然而取得這些報告並不容易。透過臺灣集保中心的『ESG IR平臺』,投資人可以方便查詢國際及國內評分機構對臺灣上市櫃公司的評分。ESG評分雖非投資保證,但有助於判斷公司的可持續性和投資風險
Thumbnail
最近00937B很紅,搭上降息話題,很多朋友想了解這檔債券ETF的基本資料,又不知道哪裡找,這裡介紹使用MoneyDJ查詢ETF的基本資料   可在首頁->ETF介紹->基本資料,舉例查詢00937B 群益ESG投等債20+。 在基本資料下拉選單選擇群益投信->群益ESG投等債20+,如此
Thumbnail
最近00937B很紅,搭上降息話題,很多朋友想了解這檔債券ETF的基本資料,又不知道哪裡找,這裡介紹使用MoneyDJ查詢ETF的基本資料   可在首頁->ETF介紹->基本資料,舉例查詢00937B 群益ESG投等債20+。 在基本資料下拉選單選擇群益投信->群益ESG投等債20+,如此
Thumbnail
參數化查詢是一種將參數值傳遞給SQL語句的技術,這些參數值不會被直接解釋為SQL語法。這樣可以防止惡意用戶通過在輸入中插入惡意的SQL語法來攻擊資料庫。參數化查詢的一個主要優點是它能夠提高安全性,同時也能夠幫助資料庫優化查詢。
Thumbnail
參數化查詢是一種將參數值傳遞給SQL語句的技術,這些參數值不會被直接解釋為SQL語法。這樣可以防止惡意用戶通過在輸入中插入惡意的SQL語法來攻擊資料庫。參數化查詢的一個主要優點是它能夠提高安全性,同時也能夠幫助資料庫優化查詢。
Thumbnail
這邊介紹使用MoneyDJ查詢ETF的基本資料,可以再首頁->ETF介紹->基本資料,舉例查詢00679B 元大美國政府20年期(以上)債券基金。MoneyDJ網站推廣(MoneyDJ是威利財經角的合作夥伴): 在基本資料下拉選單選擇元大投信->元大美國政府20年期(以上)債券基金,如此可以查詢到E
Thumbnail
這邊介紹使用MoneyDJ查詢ETF的基本資料,可以再首頁->ETF介紹->基本資料,舉例查詢00679B 元大美國政府20年期(以上)債券基金。MoneyDJ網站推廣(MoneyDJ是威利財經角的合作夥伴): 在基本資料下拉選單選擇元大投信->元大美國政府20年期(以上)債券基金,如此可以查詢到E
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News