vocus logo

方格子 vocus

AI 名詞解釋:透過帶新人理解大語言模型、提示詞、智慧代理 Agent、技能包 Skills 的作用

更新 發佈閱讀 18 分鐘

大語言模型、提示詞、智慧代理、技能包、MCP,這些 AI 名詞到底在講什麼?它們之間又是什麼關係?這篇文章用一個你一定經歷過的場景來解釋:帶一個剛畢業的新人。想像你接手了一個讀書很厲害、但完全沒社會經驗的小助理,你得想辦法讓他發揮戰力。帶他的過程,就是理解這些 AI 概念的過程。

這篇適合誰?

想好好學 AI,但被一堆名詞搞得越來越混亂的人。

比如你可能有這些困惑:

  • 提示詞、上下文、記憶,這三個聽起來很像,到底差在哪?
  • 技能包跟工作流有什麼不同?為什麼需要技能包?
  • 智慧代理 Agent 到底在做什麼?跟直接跟 AI 對話差在哪?
  • 這些概念之間的關係是什麼?誰先誰後?
raw-image

秘訣分享:做自己的學習地圖

如果你已經把這些名詞都搞懂了,你可以把這些你已經理解的內容,透過 ChatGPT 或者 Claude 的專案模式,直接做成一張自己的學習地圖。

以後遇到新的概念、技術,丟進去跟你已經會的東西做比對,馬上就知道它跟你學過的哪個概念有關、差在哪裡,不用每次從零開始學。而且不限於 AI 喔,每個新領域學習都很適合。

做法我另外寫了一篇教學,有興趣可以看這裡

👉 兩招解決 AI 資訊焦慮:做自己的學習地圖,加一份個人設定檔 https://vocus.cc/article/699bc518fd89780001ada2ae

開場:你的新助理「大語」報到了

你有沒有這種經驗?公司來了一個新人,學歷很漂亮,面試的時候對答如流,感覺什麼都懂。

結果真正開始工作之後,你才發現:他什麼都不會。

每一件事都要你從頭教起。

raw-image

今天我們要聊的這些 AI 概念,其實就是在講同一件事:你怎麼帶好這個新人,讓他從什麼都不會,變成能幫你分擔工作的得力助手。

我們就叫這個新人「大語」吧。他的全名叫「大語言模型」(Large Language Model,簡稱 LLM)。

大語有一個很明顯的特質:讀書讀得非常好,理解力強,表達能力也好。你跟他講什麼,他都聽得懂,也能給你一段看起來很有道理的回覆。

但問題是,他完全沒有社會經驗。沒有做過任何實務工作,沒有操作過任何工具,甚至連你們公司的基本資訊都不知道。

所以接下來,你這個主管要做的事情就是:想盡辦法把大語教好,讓他能真正幫上忙。

而你帶他的每一個步驟,都對應著一個 AI 領域的概念。

怎麼交代大語做事:提示詞(Prompt)

大語有一個很特殊的工作模式:你只能用文字跟他溝通。

你不能帶他去現場看,不能給他一個眼神暗示就希望他懂,只能一次寫一段話給他,然後他回你一段話。就是這樣,一來一回。

所以你很快就發現,交代事情的方式非常重要。

你寫得越清楚,他做出來的東西就越好。你寫得模糊,他就自己腦補、亂做。

這個「你寫給大語的完整指示」,就叫做提示詞(Prompt)。

其實就是你交代工作的方式。

補充背景知識:上下文(Context)

很快你就會發現,光是給指示還不夠。

比如你跟大語說:「幫我回覆這封客戶信件。」

大語會問你:「這個客戶是誰?之前有什麼互動?公司的回信風格是什麼?」

因為他是新人嘛,他什麼背景都不知道。所以你除了給指示之外,還要附上一堆背景資訊:客戶的基本資料、之前的往來紀錄、公司的 SOP。

這些你額外補充給大語的背景資訊,就叫做上下文(Context)。

你可以把它想成:交代工作的時候,除了說「做什麼」,還要告訴他「為什麼」和「相關資訊有哪些」。

大語沒有記性:記憶(Memory)

接下來你會遇到一個讓人崩潰的問題。

大語這個人啊,是金魚腦!每次對話都是全新的開始。你昨天跟他聊了兩個小時,交代了一堆事情,今天早上他全部忘光。

不是他故意的,他天生就是這樣。每次跟他對話,他只記得「這一次」你跟他說的內容。之前的對話?完全不記得。你一定要記住這件事,這就是他的思維運作方式,目前改不了。

那怎麼辦?

你想了一個辦法:每次要交代新任務之前,先把之前的對話重點整理好,放進這次的上下文裡面。這樣大語雖然本身沒有記性,但因為你幫他把「之前的紀錄」帶進來了,他就像是記得一樣。

這種「幫大語補上之前對話紀錄」的做法,就叫做記憶(Memory)。

說白了就是你幫他做筆記,每次上班前先讓他看一遍。

而且這些筆記還可以再請大語幫忙整理摘要,把太長的紀錄壓縮成重點。這樣每次帶進來的量就不會太多,大語也能更快進入狀況。

大語不會自己查資料:網路搜尋(Web Search)

到這裡,大語已經可以根據你給的資訊做出不錯的回覆了。但你很快就發現下一個問題:

他不會自己上網查東西。

你問他最近的產業趨勢,他只能根據他在學校學過的東西回答。畢業之後的知識,他就都不知道了。

更糟的是,如果他不知道但又想表現,他就會開始掰。講得頭頭是道,但內容是錯的。

這在 AI 領域有個專有名詞叫「幻覺」,就是 AI 很有自信地跟你講了一段完全是編的內容。

所以你告訴大語:「如果你不確定的事情,不要自己瞎猜,告訴我你需要查什麼資料,我幫你找。」

然後你發現,與其每次都自己幫他查,不如教他怎麼用搜尋引擎。你幫他接上了網路搜尋的能力,讓他可以自己上網找資料,再根據找到的內容來回答你的問題。

這就是網路搜尋(Web Search),讓大語能夠搜尋網路上的公開資訊。

翻自己的資料夾:檢索增強生成(RAG)

網路搜尋解決了「查外面的資料」的問題。但還有另一種情況:你需要大語查的東西,不在網路上。

比如公司內部的客戶資料、產品規格文件、過去的會議紀錄。這些東西是公司內部的,Google 搜不到。

那怎麼辦呢?

你幫大語準備了一個資料夾(知識庫),把公司內部的文件都整理進去。大語需要的時候,就去這個資料夾裡面找跟他問題相關的段落,然後帶著這些資訊回來回答你。

這個做法有個專有名詞,叫做檢索增強生成(Retrieval Augmented Generation),簡稱 RAG。

聽起來很厲害,其實就是「先去翻資料夾裡的文件,再來回答問題」。

順帶一提,大語找得好不好,除了他本身的能力之外,你給他的資料夾品質也很重要。如果裡面塞了一堆沒整理過的東西,太雜太亂,甚至有過時或錯誤的資料,那他要嘛找不到需要的東西,要嘛找到了錯的,然後很有自信地拿去用。

不要期待大語可以自己分辨哪些重要、哪些是對的。他就是個新人,他不懂。你給他什麼,他就信什麼,照著回答。所以你整理資料這件事,直接決定了大語回答的品質。

RAG 跟網路搜尋的差別在於:網路搜尋是上網查公開資訊,RAG 是查你自己準備好的內部資料。兩個都是幫大語取得他本身不知道的資訊,只是來源不同。

[[2026-02-18 AI 知識地圖:RAG 的三種等級]] [[2026-02-17-1613 草稿:超圖概念整理:從知識超圖到人際超圖]]

你太忙了,請人幫忙盯:智慧代理(Agent)

到目前為止,所有的事情都是你親自在處理的。你要自己寫指示、整理背景資料、幫大語帶記憶、幫他接上搜尋工具。

但你是主管啊,你自己也有一堆事要做。不可能整天盯著大語。

所以你做了一件事:寫了一套標準作業流程,讓一個自動化程式來幫你盯著大語。

這個程式負責做幾件事:

把你的任務轉交給大語,然後把大語的回覆轉給你。如果大語說他需要查資料,這個程式就自動幫他跑搜尋,把結果餵回去。如果大語說他需要用某個工具,這個程式就自動幫他調用。

在外人看來,你只是丟了一個任務進去,就拿到了結果。背後大語跟程式之間來來回回溝通了好幾輪,你完全不用管。

這個幫你盯著大語、幫他跑腿的自動化程式,就叫做智慧代理(Agent)。

名字聽起來很科幻,但它做的事情其實很樸實:就是幫你傳話、幫大語跑腿。把你不需要親自處理的溝通和操作自動化掉。

核心邏輯是這樣的:一個任務裡面,有些部分需要大語的理解力和判斷力(比如讀懂客戶的意思、決定怎麼回覆),有些部分是固定的操作(比如搜尋資料、存檔、發送信件)。智慧代理就是把「不需要大語動腦的部分」用程式處理掉,讓大語專注在他擅長的事情上。

約定回報格式:函數調用(Function Calling)

智慧代理在幫你盯大語的過程中,很快遇到一個問題。

大語這個人回答問題的時候,喜歡用很自然的語言。這種回覆,人聽得懂,但程式很難處理。因為程式需要的是精確的指令。

所以智慧代理跟大語之間需要一個約定:當大語需要使用工具的時候,不要用口語描述,請用固定的格式回覆。

就像你跟新人說:「以後要申請東西,不要直接 LINE 我,要填這張表單。表單上面第一欄寫你要用什麼工具,第二欄寫你要做什麼,第三欄寫相關資料。」

格式統一,處理起來才快。

這個「智慧代理和大語之間約定好的回報格式」,就叫做函數調用(Function Calling)。其實就是一個溝通約定,讓程式能快速讀懂大語的需求。

規格太多怎麼辦:模型上下文協議(MCP)

好了,現在智慧代理可以幫大語調用各種工具了。搜尋引擎、資料庫、日曆、信件系統,各式各樣的工具。

但這就像你叫大語整理一堆資料,結果發現資料來源五花八門。照片存在記憶卡裡,檔案在 USB-A 的隨身碟,筆電只有 USB-C 的接口,簡報要投影還得接 HDMI。每個裝置的接口都不同,光找轉接線就找半天。

那怎麼辦?你買了一個 USB Hub,多功能轉接器。不管是 USB-A、USB-C、HDMI、SD 卡,全部都能透過它統一連接。

MCP 就是 AI 世界裡的那個 USB Hub。

MCP 全名是模型上下文協議(Model Context Protocol),聽起來很複雜,但做的事情很簡單:它制定了一套統一的標準,讓各種工具服務都能用同一種方式被智慧代理調用。不用每個工具都寫一套專屬的連接方式。

所以 MCP 跟前面說的函數調用完全是不同的東西:

函數調用是智慧代理和大語之間的溝通約定,解決的是「大語怎麼告訴智慧代理他要用什麼工具」,也就是要有固定格式的申請表單。

MCP 是智慧代理和工具服務之間的連接標準,解決的是「智慧代理怎麼跟各種工具對接」,也就是轉接口要統一。

一個管溝通格式,一個管工具連接。兩邊各管各的。

固定流程不用每次重教

到這裡,你已經有了一個還不錯的工作系統:大語負責動腦,智慧代理負責跑腿,各種工具透過 MCP 串接好了。

但你又發現一個問題。

假設有一個任務是這樣的:「把這份英文 PDF 的內容提取出來,翻譯成中文,存成 Markdown 格式。」

這個任務其實流程很固定:提取 PDF → 翻譯 → 存檔。每次都是這三步。

如果每次都讓智慧代理自己去判斷流程,有幾個問題。第一,他每次可能走不同的路,結果不穩定。第二,每次重新規劃流程會消耗很多資源。明明是固定流程,何必每次都讓他重新想一遍呢?

所以你開始想辦法把固定的流程「寫下來」,讓大語和智慧代理照著做就好。

這件事有幾種不同的做法,從最死板到最彈性,剛好形成一個光譜。

用程式寫死:LangChain

最直接的方式,就是用程式碼把整個流程寫死。

第一步做什麼、第二步做什麼、第三步做什麼,全部用程式碼定義好。每一步之間的串接邏輯也寫好。

這種做法非常穩定,因為完全沒有模糊空間。但也因為太死板了,如果流程需要調整,你就得改程式碼。

為了方便寫這種「串接式任務」,有人開發了一個編程框架,叫 LangChain。就是專門用來寫「大語跟工具之間的串接流程」的工具。

低代碼拖拽:工作流(Workflow)

不是每個人都會寫程式。所以又有人做了一種「低代碼」的方式:在一個視覺化的介面上,用拖拽的方式設計流程。

A 做完接 B,B 做完接 C,用圖形化的方式把流程連起來。

這個做法叫工作流(Workflow),簡單來說就是在白板上,畫流程圖給大語看。

跟 LangChain 的差別在於上手門檻比較低,不用寫程式碼,會畫圖就好了。但本質一樣,都是你在定義一個固定的流程。

給手冊讓他自己判斷:技能包(Skill)

LangChain 和工作流有一個共同的限制:流程是你事先定義好的。

但實際工作中,很多時候情況會變。同樣是「把文件翻譯成中文」,原始文件可能是 PDF,也可能是 Word、TXT、PPT。輸出格式可能要 Markdown,也可能要 HTML 或另一份 PDF。

你不可能為每一種排列組合都做一套工作流。

這時候就需要一種更有彈性的做法了。你可以這樣想:

與其幫大語把每一步都規定死,不如寫一份「工作手冊」給他。手冊裡面說明整體的流程邏輯、需要注意的地方、各種情況該怎麼處理。然後把可能用到的工具腳本都準備好,放在一個目錄裡。

大語拿到任務之後,先讀手冊,了解流程和規則。然後根據實際情況,自己判斷要用哪些工具、怎麼組合。

這個「操作手冊+工具說明書」的組合,就叫做技能包(Skill)。

技能包真正的價值在哪裡呢?

從文件格式來看,技能包其實就是一份寫得很清楚的提示詞,加上一些範例和工具腳本。格式很簡單,這是刻意的,因為要讓各種 AI 都能通用。

真正創新的地方是:它定義了一套標準,讓 AI 知道「我要怎麼使用這份操作手冊」。什麼時候載入、怎麼讀取、讀完之後怎麼執行。這個「AI 怎麼使用技能包」的標準,才是關鍵。

還可以把你的專業判斷標準(規則、邏輯)寫進去。什麼情況該用 A 方案、什麼情況該用 B 方案,你的依據是什麼、為什麼這樣選擇。

從剛性到柔性的光譜

把這四種做法排在一起看,你會發現它們其實是一個光譜:

LangChain:完全用程式碼控制,最穩定,但最沒彈性。

工作流:用圖形化的方式設計流程,上手門檻低一些,但本質一樣是固定流程。

技能包:給大語工作手冊和工具箱,讓他在一定範圍內自己判斷。有彈性,同時又不至於失控。

純智慧代理(Pure Agent):什麼都不預設,讓大語自己規劃流程、自己找工具。最有彈性,但也最不可控。

這四種做法各有適合的場景。流程越固定、越重複的任務,適合用越剛性的方式。流程越多變、需要判斷的任務,適合用越柔性的方式。

回頭看全貌

我們來回頭看一下。

你會發現,前面講的這些概念,做的事情歸根結底就兩件:

第一,幫大語補充他不知道的資訊。 上下文、記憶、網路搜尋、RAG、技能包,全部都是在做這件事。

第二,減少你跟大語之間的溝通次數。 智慧代理、函數調用、MCP、工作流,這些都是在做自動化,讓你不用每一步都親自盯著。

就這樣。所有看起來很複雜的概念,最後都回到這兩個目標。

而第一個目標「補充資訊」這件事,還有一個關鍵:資料不是越多越好。

提示詞太精簡,背景資訊給太少,很多事情交代不清楚,大語就自己腦補亂做。

但如果一口氣給太多呢?你叫他把公司這十年來的所有檔案全部看完,他頭也會昏,反而抓不到重點。

所以應該規劃一下:他現在在做什麼任務,就給他這個任務需要的資料就好。這樣他既能保持專注,又不會搞錯方向。

這件事,就是現在常說的「上下文工程」(Context Engineering)。前面講的上下文、記憶、RAG、技能包,全部都是上下文工程的一部分,都在處理同一個問題:怎麼在對的時間,給對的資訊。

那我們能做什麼?

大語的腦袋怎麼訓練,那是學校,也就是 OpenAI、Anthropic、Google 這些 AI 公司在做的。那些外部工具和連接介面,也都是現成的,就像公司裡的隨身碟、投影機一樣,我們沒辦法自己開發。

我們一般人,能做的就是兩件事:把參考資料整理好,把工作手冊寫清楚。

對應到 AI,就是把資料夾(知識庫)整理好,讓大語能找到正確的資料。然後把操作手冊(技能包)寫清楚,告訴他遇到什麼情況該怎麼處理、判斷標準是什麼。

其他的,我們只能等。等下一梯的大語變得更聰明,等硬體介面統一,就像 USB 慢慢都變成 USB-C,不用再搞一堆轉接器。這些是時代會自己更新的。

而整理資料、寫好技能包,是不會寫程式、不會訓練模型的一般人,最能做、也最值得做的事情。

raw-image

概念對照表

raw-image


我是江江教練

隱性知識提煉師、AI 應用規劃師

對 AI × 知識管理、隱性知識提煉有興趣?

歡迎加入我的 LINE 社群

https://line.me/R/ti/g2/V63_43ngbs_kq1mpVc9LlxXB-1kchHnwdsy3WQ

我每月固定舉辦兩場免費線上講座,分享實戰經驗與方法論。如果你對這些主題感興趣,想持續學習,或是有顧問需求,都歡迎先從社群開始。

主要討論:

🔸 善用 AI 作為思考夥伴,提升決策品質與思考深度。

🔸 把知識、經驗,整理成提示詞、技能包、知識庫,讓 AI 能靈活運用。

raw-image




留言
avatar-img
個人知識管理 X AI 應用|江江教練
136會員
47內容數
嗨,我是江昱德|江江教練。 隱性知識提煉師 X AI 應用規劃師 我每月固定舉辦兩場免費線上講座,講座資訊請看我的LINE社群 我專注在: 把知識、經驗,整理成提示詞、技能包、知識庫,讓 AI 能靈活運用。 這裡會分享我的策略與實作經驗。
2025/12/27
老客戶也能拿半價!一招解鎖新戶優惠,搭配家庭共享,每人每月只要 55 元就能用 Gemini Advanced。但如果你想找陌生人揪團,有四個致命隱憂你必須先知道,特別是「12 個月冷卻期」。
Thumbnail
2025/12/27
老客戶也能拿半價!一招解鎖新戶優惠,搭配家庭共享,每人每月只要 55 元就能用 Gemini Advanced。但如果你想找陌生人揪團,有四個致命隱憂你必須先知道,特別是「12 個月冷卻期」。
Thumbnail
2025/12/26
AI 越用越慢、回答品質變差、額度快速耗盡、甚至可能導致資料遺失?。本文從真實案例出發,揭露對話累積的五大隱憂,並提供三招解決方案,幫助知識工作者提升 AI 使用效率,讓寶貴的數位資產不再因 AI 使用不當而蒙受損失。不論是 ChatGPT、Claude 還是 Gemini,都能適用。
Thumbnail
2025/12/26
AI 越用越慢、回答品質變差、額度快速耗盡、甚至可能導致資料遺失?。本文從真實案例出發,揭露對話累積的五大隱憂,並提供三招解決方案,幫助知識工作者提升 AI 使用效率,讓寶貴的數位資產不再因 AI 使用不當而蒙受損失。不論是 ChatGPT、Claude 還是 Gemini,都能適用。
Thumbnail
2025/12/22
你是不是也遇過這種狀況?想把家裡的貓放進電影場景裡,或把自己 P 進夢想地點,但合成出來的圖總是假假的,人物看起來就不太像? 問題出在哪?很多人想一次搞定所有東西,結果 AI 顧此失彼,場景對了主角就失真,主角對了場景就很怪。 今天跟你分享一個成功率很高的方法:場景先決合成法。 核心概念很簡單,
Thumbnail
2025/12/22
你是不是也遇過這種狀況?想把家裡的貓放進電影場景裡,或把自己 P 進夢想地點,但合成出來的圖總是假假的,人物看起來就不太像? 問題出在哪?很多人想一次搞定所有東西,結果 AI 顧此失彼,場景對了主角就失真,主角對了場景就很怪。 今天跟你分享一個成功率很高的方法:場景先決合成法。 核心概念很簡單,
Thumbnail
看更多