目前,「AI代理人 AI Agent」這個字,
大概就是指人類如何與「大語言模型 (Large Language Model; LLM)」互動。
而在Micheal Lanham 的著書,《AI Agents in Action》的第一章[1],提到了四種人類與大語言模型互動的方式:
1 直接用戶互動 Direct User Interaction
2 代理人 Agent / 助理代理 Assistant Proxy
3 代理人 Agent/ 助理 Assistant
4 自動代理人 Autonomous Agent
第一種方式,
就是指直接去跟ChatGPT討論問答案,
也是我每天主要使用大語言模型的方式。
第二種方式,
則是指LLM根據我的要求,
去調用專門做我指定的任務的另一個Agent,
來滿足我的需求。
例如在ChatGPT使用Dall-E 3畫圖,
或者呼叫自己定義的GPTs,都屬於這個方式。
第三種方式,
則是將LLM當作是一種「外掛 Plugin」,
在其他的程式使用。
例如我曾在Obsidian[2]軟體上使用外掛安裝語言模型,
來讓語言模型分析我的數位筆記。
但效果不太好,後來我就放棄使用了。
第四種方式則很進階且理想,
就是你可以跟AI代理人說一個模糊的任務,
然後AI代理人自己去想辦法解決,
而且中間還會涉及AI代理人要自己去做決定。
我覺得這個想像空間很大,
例如報稅,報帳,規劃旅遊行程這類的事情,
我都很不喜歡花時間做。
要是有個自動代理人能幫我完成這些,
那就真的非常理想了。
期待那樣的世界趕快來臨。
Reference
[1] Section 1.1, https://www.manning.com/books/ai-agents-in-action
[2] https://obsidian.md/