《什麼是 AI Agents?》

Jauh Tom-avatar-img
發佈於品書開卷 個房間
更新於 發佈於 閱讀時間約 12 分鐘

簡介

《What Are AI Agents?》由 Benjamin Labaschin 撰寫,旨在解釋人工智慧代理(AI Agents)的概念、技術運作原理,以及它們如何運用在實際生活與工作的情境中。該書重點闡述了大型語言模型(LLMs)與 AI 代理的關係,並深入探討這些代理如何在文件問答、聊天機器人和程式碼輔助等領域提供解決方案。此外,作者也提出了AI代理的挑戰與未來可能的發展方向,包括基礎設施、法律倫理問題和市場的變化。

raw-image


書籍評價

  1. 內容深度與實用性 本書清晰地定義並解釋了 AI 代理的基本概念,使讀者能快速掌握其核心功能。書中使用了具體的實例,例如如何使用文件問答代理來簡化工作流程、如何設計聊天機器人以解決動態問題,以及程式碼助理如何提升開發效率。對於新手讀者來說,這是入門 AI 代理技術的良好資源。
  2. 案例豐富與實踐導向 書中列舉了許多現實世界中的應用場景,如 Chainlit、HuggingFace Chat 和 GitHub Copilot 等實際工具,幫助讀者理解如何將 AI 技術應用於日常生活和工作。這些案例不僅說明了技術的潛力,也突出了其實際價值。
  3. 未來展望與批判性討論 本書不僅聚焦於技術的應用,還討論了 AI 代理在基礎設施、法律和倫理方面的挑戰,尤其是在數據隱私和偏見等問題上的可能影響。這種批判性視角為讀者提供了更全面的理解。
  4. 結構清晰,易於閱讀 該書的結構明確,分為定義與背景介紹、應用實例、工具教學以及未來趨勢等部分,對於不同需求的讀者而言都十分友好。

總結

這本書適合對人工智慧感興趣的技術專業人士以及希望了解 AI 代理基礎和實際應用的普通讀者。透過簡明的語言與實例,作者成功地將複雜的技術概念轉化為易懂的內容,是一本極具啟發性的作品。


什麼是 AI Agents?

根據 Benjamin Labaschin 所著的《What Are AI Agents?》,AI Agents(人工智慧代理)是一種工具,設計目的是幫助使用者更高效或更有創意地完成工作流程。以下是 AI Agents 的定義及其主要特點:

  1. 基於大型語言模型(LLMs): AI Agents 通常是「使用者界面(UI)包裝層」,圍繞大型語言模型運行(如 GPT-4)。 它們使得使用者能夠更容易地與這些模型互動,而不需要專業技術或花費大量時間建立自己的語言模型。
  2. 簡化互動: AI Agents 提供用戶友好的前端,減少了模型操作的技術性挑戰。例如,ChatGPT 是一種 AI Agent,它通過簡單的文本界面讓使用者與 GPT-4 模型互動。
  3. 功能多樣性: AI Agents 根據任務需求使用不同的 LLM,例如: 代碼輔助工具(如 GitHub Copilot)。 文檔問答工具。 聊天機器人代理(Chatbot Agents)。
  4. 運行方式類比汽車與引擎: 可以將 AI Agents 比作汽車,而 LLM 是其引擎。不同的任務會需要不同類型的引擎,例如專為代碼輔助設計的 LLM,與通用型 LLM 有所不同。
  5. 日益增長的重要性: AI Agents 的成功依賴於直觀的設計、針對特定任務的高效性,以及能讓普通用戶無需理解其內部運作的便捷性。

此書還討論了 AI Agents 的應用場景(如文檔問答代理、聊天代理和代碼輔助工具),以及未來的發展方向(如基礎設施改進、安全性及倫理挑戰)。


以下是《What Are AI Agents?》一書中有關 AI Agents 的應用場景及細節總結:

AI Agents 應用場景

  1. 文件問答代理(Document Q&A Agents) 用途:解決信息過載問題,快速從文件中提取關鍵信息。 場景描述: 新員工可使用文件問答代理來查詢入職文件中的關鍵資訊,如工作時間、IT細節等,避免手動翻閱大量文件。 工具範例:像 Chainlit 和 PandasAI,這些工具可通過自然語言界面進行查詢和篩選文件數據。
  2. 聊天機器人代理(Chatbot Agents) 用途:處理動態互動,執行如數據庫查詢、信息核實等多功能操作。 場景描述: 使用聊天機器人 BERTA 來驗證用戶信息並激活內部軟件權限。 適用場合:用於需要連接第三方系統(如數據庫、互聯網)的情境,例如客服支援或流程自動化。
  3. 程式碼助理代理(Code Assistant Agents) 用途:幫助開發者更高效地編寫程式碼,包括錯誤修正、自動補全和模板生成。 場景描述: 開發者可使用程式碼助理將 Python 程式碼翻譯為 Java,無需深入了解另一種語言。 工具範例:GitHub Copilot、Amazon CodeWhisperer 等。

AI Agents 的關鍵細節

  1. 基於 LLM 的動力:AI Agents 本質是為 LLM(大型語言模型)提供友好接口,能針對特定任務進行優化。
  2. 模組化設計:類似於汽車引擎,AI Agents 的表現依賴其搭載的 LLM,例如針對編碼優化的模型用於程式碼助理代理。
  3. 簡化用戶操作:用戶無需了解 LLM 的內部運作即可使用代理完成複雜任務。

未來發展方向

  1. 增強型搜尋(Augmented Search):搜尋技術將因 AI 的整合變得更高效。
  2. 產品整合與隔離:部分企業積極採用 AI 以提升市場競爭力,而一些企業選擇保持現狀。
  3. 基礎設施改進:運行 LLM 的成本高昂,但逐漸有更高效的本地化解決方案出現。
  4. 安全與道德挑戰:需重視資料隱私、模型倫理和法律監管。

本書深入探討了 AI Agents 的多樣化應用,從文件管理到程式設計,展示了其廣泛的實用性和未來潛力。


Chainlit 的應用場景

  1. 文件問答代理 (Document Q&A Agents): 應用範圍:幫助用戶快速查詢和整理大量文檔中的信息,節省手動檢索的時間。 功能特性:用戶上傳文檔,Chainlit 會處理數據,允許用戶用自然語言詢問問題,並提供精準回答。 範例場景: 新員工入職時,可以使用該工具查詢公司政策和流程,而無需手動閱讀所有文檔。 用戶提供一本書或技術手冊的數據,並詢問特定章節或主題內容。
  2. 數據探索與過濾: 數據處理能力:Chainlit 與 PandasAI 相結合,可進行數據的篩選、彙總或可視化。 應用範例: 用戶可以指定特定的出版商(例如:O'Reilly Media),只查看相關書籍的數據。 根據書籍主題(例如數據科學或機器學習)進行分類查詢。

Chainlit 的實現細節

  1. 技術支持: Chainlit 作為用戶界面的交互層,與 PandasAI 等工具整合來進行數據處理和回答問題。 使用底層 LLM(大型語言模型)處理自然語言查詢,提升回答的準確性和相關性。
  2. 操作步驟: 用戶通過 Chainlit 的界面上傳文件,系統會自動提取文件中的信息,並顯示可用的數據列。 用戶通過自然語言提問,例如「顯示關於機器學習的書籍列表」或「篩選出某個出版商的書籍」,系統根據查詢返回結果。
  3. 實例演示: 在範例圖中,Chainlit 被用來處理和過濾與計算機科學書籍相關的數據,並精準回答與數據相關的問題。
  4. 擴展性: 用戶可以將 Chainlit 與其他 LLM 代理集成,用於多樣化的文檔和數據處理需求。 可調整工具以適應企業專屬需求,例如內部文件查詢或大規模數據分析。

這些應用場景表明,Chainlit 在處理大規模文本和數據查詢時具有高度實用性和效率,非常適合文檔管理、自動化數據分析等需求。


以下是建立 AI Agent 的詳細步驟,讓你可以在 ChatGPT 中打造屬於自己的智慧代理,適合新手朋友嘗試!


1. 明確目標:先搞清楚你想幹嘛!

先問自己:「這個 AI Agent 要幹啥?」


例如:


  • 要它幫你寫小說?(文學小助理)
  • 幫你管理日程?(生活秘書)
  • 還是讓它專門吐槽你?(搞笑夥伴)

當目標清楚後,設計就會有方向。記住,不要讓它太全能,否則像是一個打雜的。


2. 建立框架:開工前準備一下!

你需要一個 ChatGPT 的 API 或 OpenAI 平台的帳號。具體步驟如下:

  1. 註冊 OpenAI 帳號:到 OpenAI 官網 註冊一個帳號。
  2. 獲取 API 金鑰:在個人帳戶設置中找到你的 API Key,這是一串看起來像外星文的東西,但它是你的入口鑰匙。
  3. 選擇工具:你可以選擇直接用 Python 或透過現成的整合平台(例如 No-code 工具)來開發。

3. 寫程式:讓 AI 動起來!

這裡提供簡單的 Python 程式範例(不用怕,超容易的!):

先裝好工具:

pip install openai

然後寫個範例程式:

import openai

# 設定你的 API 金鑰
openai.api_key = "你的API金鑰"

# 定義 AI 的角色
def chat_with_ai(user_input):
response = openai.ChatCompletion.create(
model="gpt-4",
messages=[
{"role": "system", "content": "你是一個幽默風趣的聊天機器人,可以幫助用戶解決問題,也偶爾講笑話。"},
{"role": "user", "content": user_input}
]
)
return response['choices'][0]['message']['content']

# 測試一下
while True:
user_input = input("你問:")
if user_input.lower() == "quit":
break
print("AI 回答:", chat_with_ai(user_input))

看懂了嗎?這段程式碼的關鍵在於:

  • system 角色定義了 AI 的個性。
  • user 是使用者輸入的問題。
  • AI 會根據這些內容生成答案。

4. 微調 AI 的個性:讓它更像「自己」

你可以修改 system 角色的描述,讓 AI 更符合你的需求。


例子:


  • 如果是學術助理,描述改成:「你是一個嚴謹且學術化的 AI,專注於提供研究幫助。」
  • 如果是搞笑夥伴,描述改成:「你是一個非常幽默的 AI,擅長說冷笑話,讓對話更輕鬆。」

5. 部署 AI:讓它上線!

完成程式後,你可以:

  • 本地運行:直接在自己的電腦上跑程式(適合初學者)。
  • 雲端部署:將程式部署到像 Heroku、AWS 或其他平台上,讓其他人也能用。

6. 測試與改進:不斷優化!

跟你的 AI 聊聊,看看哪裡需要改進。如果它回答太無聊,就加點幽默;回答太敷衍,就加點知識。


7. 分享成果:拉朋友一起玩!

把 AI 分享給朋友,看看他們的反應。還可以繼續改進,把功能做得更全面。


重點提醒:

  • 避免過於複雜:一開始不要想做太多功能,先專注在一兩個有趣的點上。
  • 保持幽默:AI 是工具,但跟它聊天的過程也應該是愉快的!



avatar-img
5會員
412內容數
無聊攪屎
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Jauh Tom的啦滴賽 的其他內容
《Pillars of Creation: How the James Webb Space Telescope is Transforming Our Understanding of the Cosmos》 作者:Richard Panek 簡介 《Pillars of Creation
《Tomorrow, and Tomorrow, and Tomorrow》簡介與書評 作者:Gabrielle Zevin 簡介 《Tomorrow, and Tomorrow, and Tomorrow》是一部引人深思的小說,探索友誼、創造力以及遊戲世界中的人性。故事的核心圍繞兩位兒
《The Heart and the Chip: Our Bright Future with Robots》書評 本書由 Daniela Rus 和 Gregory Mone 合著,深入探討了機器人與人工智慧如何塑造未來的工作、生活與人際關係。以下是本書書評的主要內容: 核心主題 夢想
《The Age of Em: Work, Love, and Life When Robots Rule the Earth》簡介 作者:Robin Hanson 概要: 本書由經濟學家 Robin Hanson 撰寫,探索了一個以「腦機複製」技術為基礎的未來世界。在這個未來,數位化的人類大腦
《The Singularity Is Near: When Humans Transcend Biology》簡介 本書由 Ray Kurzweil 所著,探討人類與技術融合的未來,以及即將到來的「奇點」(The Singularity)如何徹底改變我們對人類、生命與宇宙的理解。 主要主
《Rise of the Robots: Technology and the Threat of a Jobless Future》簡介 本書由 Martin Ford 撰寫,深入探討了自動化技術與人工智慧的發展如何影響全球經濟,並聚焦於其對就業市場的顛覆性影響以及可能帶來的社會和經濟挑戰。以下
《Pillars of Creation: How the James Webb Space Telescope is Transforming Our Understanding of the Cosmos》 作者:Richard Panek 簡介 《Pillars of Creation
《Tomorrow, and Tomorrow, and Tomorrow》簡介與書評 作者:Gabrielle Zevin 簡介 《Tomorrow, and Tomorrow, and Tomorrow》是一部引人深思的小說,探索友誼、創造力以及遊戲世界中的人性。故事的核心圍繞兩位兒
《The Heart and the Chip: Our Bright Future with Robots》書評 本書由 Daniela Rus 和 Gregory Mone 合著,深入探討了機器人與人工智慧如何塑造未來的工作、生活與人際關係。以下是本書書評的主要內容: 核心主題 夢想
《The Age of Em: Work, Love, and Life When Robots Rule the Earth》簡介 作者:Robin Hanson 概要: 本書由經濟學家 Robin Hanson 撰寫,探索了一個以「腦機複製」技術為基礎的未來世界。在這個未來,數位化的人類大腦
《The Singularity Is Near: When Humans Transcend Biology》簡介 本書由 Ray Kurzweil 所著,探討人類與技術融合的未來,以及即將到來的「奇點」(The Singularity)如何徹底改變我們對人類、生命與宇宙的理解。 主要主
《Rise of the Robots: Technology and the Threat of a Jobless Future》簡介 本書由 Martin Ford 撰寫,深入探討了自動化技術與人工智慧的發展如何影響全球經濟,並聚焦於其對就業市場的顛覆性影響以及可能帶來的社會和經濟挑戰。以下
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
背後的機制是: 人類用戶:設定目標 AI Agent:定義任務排序任務 (Defining and Sequencing Tasks),執行任務 (Task Execution),評估 (Evaluation) 而這途中,AI Agent可以使用大語言模型,可以使用網路,可以使用其他工具。
目前,「AI代理人 AI Agent」這個字, 大概就是指人類如何與「大語言模型 (Large Language Model; LLM)」互動。 而在Micheal Lanham 的著書,《AI Agents in Action》的第一章[1],提到了四種人類與大語言模型互動的方式:
「AI 代理人 AI Agent」是一個充滿魅力的概念。 我第一次接觸到Agent這個字, 是博士時期研究Bandit Algorithms [1], 在「強化學習 Reinforcement Learning」的literature中看到的。 在當初做Bandit Algo
Thumbnail
你對 AI 的認識有多少?你在生活或工作上有運用哪些 AI 的應用服務嗎?一起來了解這個目前很夯的議題。 根據 google 對 AI(artificial intelligence,縮寫為AI)的解釋:AI 是人工智慧,定義是打造電腦與機器的科學領域,可以進行推論、學習以及採取行動。這些過往需要
Thumbnail
大家好,今天我們來聊聊人工智慧,也就是 AI。AI 這個話題最近越來越熱,不論是商業領域還是日常生活中,我們都能見到它的身影。 那麼,我們應該如何理解這個複雜而又令人興奮的領域呢?接下來,我將用簡單易懂的方式,與大家一同了解 AI 的基礎知識。
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
Thumbnail
AI,全稱人工智慧,是指讓電腦或機器具備類似人類的智慧和能力的科學和技術。AI 可以幫助我們解決各種問題,提高效率,創造價值,甚至改變世界。但是,你知道 AI 是如何運作的嗎?你知道 AI 的歷史和未來嗎?你知道 AI 的優點和挑戰嗎?在這篇文章中,我將帶你一起認識 AI 的基本概念和發展。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
背後的機制是: 人類用戶:設定目標 AI Agent:定義任務排序任務 (Defining and Sequencing Tasks),執行任務 (Task Execution),評估 (Evaluation) 而這途中,AI Agent可以使用大語言模型,可以使用網路,可以使用其他工具。
目前,「AI代理人 AI Agent」這個字, 大概就是指人類如何與「大語言模型 (Large Language Model; LLM)」互動。 而在Micheal Lanham 的著書,《AI Agents in Action》的第一章[1],提到了四種人類與大語言模型互動的方式:
「AI 代理人 AI Agent」是一個充滿魅力的概念。 我第一次接觸到Agent這個字, 是博士時期研究Bandit Algorithms [1], 在「強化學習 Reinforcement Learning」的literature中看到的。 在當初做Bandit Algo
Thumbnail
你對 AI 的認識有多少?你在生活或工作上有運用哪些 AI 的應用服務嗎?一起來了解這個目前很夯的議題。 根據 google 對 AI(artificial intelligence,縮寫為AI)的解釋:AI 是人工智慧,定義是打造電腦與機器的科學領域,可以進行推論、學習以及採取行動。這些過往需要
Thumbnail
大家好,今天我們來聊聊人工智慧,也就是 AI。AI 這個話題最近越來越熱,不論是商業領域還是日常生活中,我們都能見到它的身影。 那麼,我們應該如何理解這個複雜而又令人興奮的領域呢?接下來,我將用簡單易懂的方式,與大家一同了解 AI 的基礎知識。
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
Thumbnail
AI,全稱人工智慧,是指讓電腦或機器具備類似人類的智慧和能力的科學和技術。AI 可以幫助我們解決各種問題,提高效率,創造價值,甚至改變世界。但是,你知道 AI 是如何運作的嗎?你知道 AI 的歷史和未來嗎?你知道 AI 的優點和挑戰嗎?在這篇文章中,我將帶你一起認識 AI 的基本概念和發展。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。