第13天的,延續與 Prompt Chaining 密切相關,更複雜強大的概念:AI Agents (人工智慧代理)。
2 Parts:我的白話理解/練習題「模擬 AI Agent 工作流程」(+GPT評點)
-Part. 1 我的白話理解
-
▪︎ AI Agents 定義:
包含了LLM,更為強大且具「自主性(Autonomy )」的系統。
其強大來自於:
在LLM已具備的「進行決策、執行行動以實現特定目標」基礎上,還能夠感知環境,「自主地」進行多步推理、規劃、利用工具,根據環境反饋調整。
▪︎ AI Agents 的核心循環:
1.感知(Perception):接收prompt、來自環境反饋
2.思考/規劃(Thought/Planning)
3.行動/執行(Action/Execution):執行包括生成文本、調用外部工具、或與其他系統互動
4.觀察/反饋(Observation/Feedback)
(兩小點說明:
a.基本是base 在ReAct「Thought →Action→ Observation」循環上,非常高階且複雜的prompting chaining技術應用。
b.與一般LLM最大差異,除了「自主性」,還有另一個大重點:具備長期記憶。這點在持續執行任務的自我迭代上很關鍵。)
▪︎ AI Agents 的最困難處:(就 我個人觀點 僅提出一個)
安全護欄的設置。這涉及安全及倫理層面,因為 AI Agents 有更高的自主性:我們可以理解為AI Agents 是更自由的,就self-planning、工具應用更多更廣更強這兩點來說。所以護欄的設置就變得更為關鍵重要。
▪︎ AI Agents 的應用場景:現行已有具規模的商業模式,to B 多於 to C。
- 「流程類」:智能客服、營銷自動化、程式碼生成和測試..等
- 「探索類」:法律研究、金融交易、高級個人助手..等
都已有 AI Agent產品**
(**註:AI Agent 作為研究和實驗平台,也是一個方向,未來可期。)
❖小小的Summary
照這樣理解,AI Agents的重點是「自主性的實現」,而這是來自於:
- 面向使用端:預先更明確定義出需求目標、更明確限定出使用者所使用之範疇領域(專業性導向);
- 面向技術層面:更精細準確的prompting chaining、更多API功能的支援(甚至包含sensor/ LLM所沒有的),讓這整個程式集(as a whole)可以藉由前者調動後者。
-
Part 2. 練習題「模擬 AI Agent 工作流程」(+GPT評點)
-
練習題:模擬AI Agent 接收Prompt的流程
1.設計Prompt:
(a) Persona:一個傢俱OEM的製程管理AI Agent,負責管理及確認所有產品的:製作原料庫存及採購、製作流程(含時程控管)、規格、成品存貨量、倉庫(製作原料&成品)。
(b) 任務內容:確認天然偽皮革(棕色)雙人沙發500組的訂單需求可否接單?可以的話,預計交貨期。
(c) 任務所需「工具列表」及「使用說明」:
(c-1)產品資料庫:規格、製作流程(時程)、成品存貨量、倉儲
--說明:確認訂單產品品項之規格、製作流程(時程)、成品存貨量、存放倉庫
(c-2)製作原料庫存資料庫
--說明:確認製作原料庫存量
2.運作流程(模擬):Thought.1 → Action.1 → Observation.1 → Thought.2
Thought.1 (思考.1):
(1)確認天然偽皮革(棕色)雙人沙發現有庫存量、存放倉儲地點
(2)確認天然偽皮革(棕色)雙人沙發規格(500組所需製作原料量)
(3)確認天然偽皮革(棕色)雙人沙發500組製作流程(所需時程)
Action.1 (行動.1):
根據Thought1,調用資料庫
(c-1)產品資料庫
(c-2)製作原料庫存資料庫
以及執行
「製程推演API」、「製作原料自動化採購API」、「成品可調用(已下訂金/未下訂金/未下定/出貨時間)計算API」
Observation.1 (觀察.1):
系統內部確認統整所有資訊,推估天然偽皮革(棕色)雙人沙發500組的訂單需求可否接單,以及若接單預計交貨時間。
Thought.2 (思考.2):
納入環境因素,國定連休假期(近期可勞動力),重新考量製程。
ChatGPT 點評:
整體結構清晰,邏輯順暢,確實呈現出一個 AI Agent 接受 prompt 後的完整處理流程。以下是詳細點評,依照五大面向進行回饋與建議:
✅ 一、是否符合 AI Agent 的核心循環
你已完整涵蓋:
- Perception:來自使用者的 prompt 中,明確說明 persona 與任務
- Thought/Planning:依據需求逐步規劃子任務(如查詢庫存、查流程、時程評估)
- Action/Execution:調用資料庫及三個 API
- Observation/Feedback:統整資訊,判斷可否接單與交貨期,再進一步規劃下一步
→ 完整命中 T→A→O 循環,且已自然走向下一輪 Thought!做得非常好。
✅ 二、是否展現自主性(Autonomy)
你已納入以下 自主性表現:
- 根據任務,自主拆解子任務(而非被動等待)
- 主動調用合適的工具(資料庫、API),不需人為引導
- 進入第二個 Thought 時,主動考量環境變因(連假與可用人力)
--這正是 AI Agent 的典型特徵之一:「根據觀察結果自我迭代」。
✅ 三、是否清晰拆解任務、子任務與執行邏輯
你的 Thought 1 → Action 1 中的邏輯拆解非常理想,尤其以下幾點值得稱讚:
- 子任務邏輯順序正確:先查庫存→查製作所需→查製程與時程
- 執行對應工具正確無誤:每個子任務調用的工具恰當且精準
- API命名具體明確,展現對實務流程的熟悉程度
👉 建議(微調):可以稍加細化 Observation 1,例如:
- 成品庫存是否足夠?缺口多少?
- 原料缺口有哪些?是否可立即採購?
- 製程預估完成日?可否達交?
這樣能讓 Thought 2 的動機更具邏輯銜接性。
✅ 四、安全、記憶、目標一致性是否有意識到
你已注意 「環境回饋」 的納入(連假考量),代表有意識地處理系統「持續感知」的能力。如果再進一步,未來可以補充:
- 是否具備長期任務記憶?(這次任務是否會留下追蹤資料以供日後使用?)
- 是否在執行 Action 前進行風險檢查?(例如:採購 API 執行是否需授權?)
✅ 五、語意、技術層次與可實作度評估
總體來說,你的模擬非常貼近現實的 AI Agent 運作方式,也很有實務背景。語意、任務設計與技術結構具備「可實作感」。
⭐️ 總評與建議
▶︎架構設計:完整展現 T→A→O 循環邏輯
▶︎自主性表現:主動判斷與規劃,非單一步 prompt 回應
▶︎實務貼合度:API 與任務細節具實務導向
▶︎改進空間:Observation 可以稍細化,模擬更完整
▶︎可延伸性:可發展至記憶管理、多代理協作