大語言模型、提示詞、智慧代理、技能包、MCP,這些 AI 名詞到底在講什麼?它們之間又是什麼關係?這篇文章用一個你一定經歷過的場景來解釋:帶一個剛畢業的新人。想像你接手了一個讀書很厲害、但完全沒社會經驗的小助理,你得想辦法讓他發揮戰力。帶他的過程,就是理解這些 AI 概念的過程。
這篇適合誰?
想好好學 AI,但被一堆名詞搞得越來越混亂的人。
比如你可能有這些困惑:
- 提示詞、上下文、記憶,這三個聽起來很像,到底差在哪?
- 技能包跟工作流有什麼不同?為什麼需要技能包?
- 智慧代理 Agent 到底在做什麼?跟直接跟 AI 對話差在哪?
- 這些概念之間的關係是什麼?誰先誰後?

秘訣分享:做自己的學習地圖
如果你已經把這些名詞都搞懂了,你可以把這些你已經理解的內容,透過 ChatGPT 或者 Claude 的專案模式,直接做成一張自己的學習地圖。
以後遇到新的概念、技術,丟進去跟你已經會的東西做比對,馬上就知道它跟你學過的哪個概念有關、差在哪裡,不用每次從零開始學。而且不限於 AI 喔,每個新領域學習都很適合。
做法我另外寫了一篇教學,有興趣可以看這裡
👉 兩招解決 AI 資訊焦慮:做自己的學習地圖,加一份個人設定檔 https://vocus.cc/article/699bc518fd89780001ada2ae
開場:你的新助理「大語」報到了
你有沒有這種經驗?公司來了一個新人,學歷很漂亮,面試的時候對答如流,感覺什麼都懂。
結果真正開始工作之後,你才發現:他什麼都不會。
每一件事都要你從頭教起。

今天我們要聊的這些 AI 概念,其實就是在講同一件事:你怎麼帶好這個新人,讓他從什麼都不會,變成能幫你分擔工作的得力助手。
我們就叫這個新人「大語」吧。他的全名叫「大語言模型」(Large Language Model,簡稱 LLM)。
大語有一個很明顯的特質:讀書讀得非常好,理解力強,表達能力也好。你跟他講什麼,他都聽得懂,也能給你一段看起來很有道理的回覆。
但問題是,他完全沒有社會經驗。沒有做過任何實務工作,沒有操作過任何工具,甚至連你們公司的基本資訊都不知道。
所以接下來,你這個主管要做的事情就是:想盡辦法把大語教好,讓他能真正幫上忙。
而你帶他的每一個步驟,都對應著一個 AI 領域的概念。
怎麼交代大語做事:提示詞(Prompt)
大語有一個很特殊的工作模式:你只能用文字跟他溝通。
你不能帶他去現場看,不能給他一個眼神暗示就希望他懂,只能一次寫一段話給他,然後他回你一段話。就是這樣,一來一回。
所以你很快就發現,交代事情的方式非常重要。
你寫得越清楚,他做出來的東西就越好。你寫得模糊,他就自己腦補、亂做。
這個「你寫給大語的完整指示」,就叫做提示詞(Prompt)。
其實就是你交代工作的方式。
補充背景知識:上下文(Context)
很快你就會發現,光是給指示還不夠。
比如你跟大語說:「幫我回覆這封客戶信件。」
大語會問你:「這個客戶是誰?之前有什麼互動?公司的回信風格是什麼?」
因為他是新人嘛,他什麼背景都不知道。所以你除了給指示之外,還要附上一堆背景資訊:客戶的基本資料、之前的往來紀錄、公司的 SOP。
這些你額外補充給大語的背景資訊,就叫做上下文(Context)。
你可以把它想成:交代工作的時候,除了說「做什麼」,還要告訴他「為什麼」和「相關資訊有哪些」。
大語沒有記性:記憶(Memory)
接下來你會遇到一個讓人崩潰的問題。
大語這個人啊,是金魚腦!每次對話都是全新的開始。你昨天跟他聊了兩個小時,交代了一堆事情,今天早上他全部忘光。
不是他故意的,他天生就是這樣。每次跟他對話,他只記得「這一次」你跟他說的內容。之前的對話?完全不記得。你一定要記住這件事,這就是他的思維運作方式,目前改不了。
那怎麼辦?
你想了一個辦法:每次要交代新任務之前,先把之前的對話重點整理好,放進這次的上下文裡面。這樣大語雖然本身沒有記性,但因為你幫他把「之前的紀錄」帶進來了,他就像是記得一樣。
這種「幫大語補上之前對話紀錄」的做法,就叫做記憶(Memory)。
說白了就是你幫他做筆記,每次上班前先讓他看一遍。
而且這些筆記還可以再請大語幫忙整理摘要,把太長的紀錄壓縮成重點。這樣每次帶進來的量就不會太多,大語也能更快進入狀況。
大語不會自己查資料:網路搜尋(Web Search)
到這裡,大語已經可以根據你給的資訊做出不錯的回覆了。但你很快就發現下一個問題:
他不會自己上網查東西。
你問他最近的產業趨勢,他只能根據他在學校學過的東西回答。畢業之後的知識,他就都不知道了。
更糟的是,如果他不知道但又想表現,他就會開始掰。講得頭頭是道,但內容是錯的。
這在 AI 領域有個專有名詞叫「幻覺」,就是 AI 很有自信地跟你講了一段完全是編的內容。
所以你告訴大語:「如果你不確定的事情,不要自己瞎猜,告訴我你需要查什麼資料,我幫你找。」
然後你發現,與其每次都自己幫他查,不如教他怎麼用搜尋引擎。你幫他接上了網路搜尋的能力,讓他可以自己上網找資料,再根據找到的內容來回答你的問題。
這就是網路搜尋(Web Search),讓大語能夠搜尋網路上的公開資訊。
翻自己的資料夾:檢索增強生成(RAG)
網路搜尋解決了「查外面的資料」的問題。但還有另一種情況:你需要大語查的東西,不在網路上。
比如公司內部的客戶資料、產品規格文件、過去的會議紀錄。這些東西是公司內部的,Google 搜不到。
那怎麼辦呢?
你幫大語準備了一個資料夾(知識庫),把公司內部的文件都整理進去。大語需要的時候,就去這個資料夾裡面找跟他問題相關的段落,然後帶著這些資訊回來回答你。
這個做法有個專有名詞,叫做檢索增強生成(Retrieval Augmented Generation),簡稱 RAG。
聽起來很厲害,其實就是「先去翻資料夾裡的文件,再來回答問題」。
順帶一提,大語找得好不好,除了他本身的能力之外,你給他的資料夾品質也很重要。如果裡面塞了一堆沒整理過的東西,太雜太亂,甚至有過時或錯誤的資料,那他要嘛找不到需要的東西,要嘛找到了錯的,然後很有自信地拿去用。
不要期待大語可以自己分辨哪些重要、哪些是對的。他就是個新人,他不懂。你給他什麼,他就信什麼,照著回答。所以你整理資料這件事,直接決定了大語回答的品質。
RAG 跟網路搜尋的差別在於:網路搜尋是上網查公開資訊,RAG 是查你自己準備好的內部資料。兩個都是幫大語取得他本身不知道的資訊,只是來源不同。
[[2026-02-18 AI 知識地圖:RAG 的三種等級]] [[2026-02-17-1613 草稿:超圖概念整理:從知識超圖到人際超圖]]
你太忙了,請人幫忙盯:智慧代理(Agent)
到目前為止,所有的事情都是你親自在處理的。你要自己寫指示、整理背景資料、幫大語帶記憶、幫他接上搜尋工具。
但你是主管啊,你自己也有一堆事要做。不可能整天盯著大語。
所以你做了一件事:寫了一套標準作業流程,讓一個自動化程式來幫你盯著大語。
這個程式負責做幾件事:
把你的任務轉交給大語,然後把大語的回覆轉給你。如果大語說他需要查資料,這個程式就自動幫他跑搜尋,把結果餵回去。如果大語說他需要用某個工具,這個程式就自動幫他調用。
在外人看來,你只是丟了一個任務進去,就拿到了結果。背後大語跟程式之間來來回回溝通了好幾輪,你完全不用管。
這個幫你盯著大語、幫他跑腿的自動化程式,就叫做智慧代理(Agent)。
名字聽起來很科幻,但它做的事情其實很樸實:就是幫你傳話、幫大語跑腿。把你不需要親自處理的溝通和操作自動化掉。
核心邏輯是這樣的:一個任務裡面,有些部分需要大語的理解力和判斷力(比如讀懂客戶的意思、決定怎麼回覆),有些部分是固定的操作(比如搜尋資料、存檔、發送信件)。智慧代理就是把「不需要大語動腦的部分」用程式處理掉,讓大語專注在他擅長的事情上。
約定回報格式:函數調用(Function Calling)
智慧代理在幫你盯大語的過程中,很快遇到一個問題。
大語這個人回答問題的時候,喜歡用很自然的語言。這種回覆,人聽得懂,但程式很難處理。因為程式需要的是精確的指令。
所以智慧代理跟大語之間需要一個約定:當大語需要使用工具的時候,不要用口語描述,請用固定的格式回覆。
就像你跟新人說:「以後要申請東西,不要直接 LINE 我,要填這張表單。表單上面第一欄寫你要用什麼工具,第二欄寫你要做什麼,第三欄寫相關資料。」
格式統一,處理起來才快。
這個「智慧代理和大語之間約定好的回報格式」,就叫做函數調用(Function Calling)。其實就是一個溝通約定,讓程式能快速讀懂大語的需求。
規格太多怎麼辦:模型上下文協議(MCP)
好了,現在智慧代理可以幫大語調用各種工具了。搜尋引擎、資料庫、日曆、信件系統,各式各樣的工具。
但這就像你叫大語整理一堆資料,結果發現資料來源五花八門。照片存在記憶卡裡,檔案在 USB-A 的隨身碟,筆電只有 USB-C 的接口,簡報要投影還得接 HDMI。每個裝置的接口都不同,光找轉接線就找半天。
那怎麼辦?你買了一個 USB Hub,多功能轉接器。不管是 USB-A、USB-C、HDMI、SD 卡,全部都能透過它統一連接。
MCP 就是 AI 世界裡的那個 USB Hub。
MCP 全名是模型上下文協議(Model Context Protocol),聽起來很複雜,但做的事情很簡單:它制定了一套統一的標準,讓各種工具服務都能用同一種方式被智慧代理調用。不用每個工具都寫一套專屬的連接方式。
所以 MCP 跟前面說的函數調用完全是不同的東西:
函數調用是智慧代理和大語之間的溝通約定,解決的是「大語怎麼告訴智慧代理他要用什麼工具」,也就是要有固定格式的申請表單。
MCP 是智慧代理和工具服務之間的連接標準,解決的是「智慧代理怎麼跟各種工具對接」,也就是轉接口要統一。
一個管溝通格式,一個管工具連接。兩邊各管各的。
固定流程不用每次重教
到這裡,你已經有了一個還不錯的工作系統:大語負責動腦,智慧代理負責跑腿,各種工具透過 MCP 串接好了。
但你又發現一個問題。
假設有一個任務是這樣的:「把這份英文 PDF 的內容提取出來,翻譯成中文,存成 Markdown 格式。」
這個任務其實流程很固定:提取 PDF → 翻譯 → 存檔。每次都是這三步。
如果每次都讓智慧代理自己去判斷流程,有幾個問題。第一,他每次可能走不同的路,結果不穩定。第二,每次重新規劃流程會消耗很多資源。明明是固定流程,何必每次都讓他重新想一遍呢?
所以你開始想辦法把固定的流程「寫下來」,讓大語和智慧代理照著做就好。
這件事有幾種不同的做法,從最死板到最彈性,剛好形成一個光譜。
用程式寫死:LangChain
最直接的方式,就是用程式碼把整個流程寫死。
第一步做什麼、第二步做什麼、第三步做什麼,全部用程式碼定義好。每一步之間的串接邏輯也寫好。
這種做法非常穩定,因為完全沒有模糊空間。但也因為太死板了,如果流程需要調整,你就得改程式碼。
為了方便寫這種「串接式任務」,有人開發了一個編程框架,叫 LangChain。就是專門用來寫「大語跟工具之間的串接流程」的工具。
低代碼拖拽:工作流(Workflow)
不是每個人都會寫程式。所以又有人做了一種「低代碼」的方式:在一個視覺化的介面上,用拖拽的方式設計流程。
A 做完接 B,B 做完接 C,用圖形化的方式把流程連起來。
這個做法叫工作流(Workflow),簡單來說就是在白板上,畫流程圖給大語看。
跟 LangChain 的差別在於上手門檻比較低,不用寫程式碼,會畫圖就好了。但本質一樣,都是你在定義一個固定的流程。
給手冊讓他自己判斷:技能包(Skill)
LangChain 和工作流有一個共同的限制:流程是你事先定義好的。
但實際工作中,很多時候情況會變。同樣是「把文件翻譯成中文」,原始文件可能是 PDF,也可能是 Word、TXT、PPT。輸出格式可能要 Markdown,也可能要 HTML 或另一份 PDF。
你不可能為每一種排列組合都做一套工作流。
這時候就需要一種更有彈性的做法了。你可以這樣想:
與其幫大語把每一步都規定死,不如寫一份「工作手冊」給他。手冊裡面說明整體的流程邏輯、需要注意的地方、各種情況該怎麼處理。然後把可能用到的工具腳本都準備好,放在一個目錄裡。
大語拿到任務之後,先讀手冊,了解流程和規則。然後根據實際情況,自己判斷要用哪些工具、怎麼組合。
這個「操作手冊+工具說明書」的組合,就叫做技能包(Skill)。
技能包真正的價值在哪裡呢?
從文件格式來看,技能包其實就是一份寫得很清楚的提示詞,加上一些範例和工具腳本。格式很簡單,這是刻意的,因為要讓各種 AI 都能通用。
真正創新的地方是:它定義了一套標準,讓 AI 知道「我要怎麼使用這份操作手冊」。什麼時候載入、怎麼讀取、讀完之後怎麼執行。這個「AI 怎麼使用技能包」的標準,才是關鍵。
還可以把你的專業判斷標準(規則、邏輯)寫進去。什麼情況該用 A 方案、什麼情況該用 B 方案,你的依據是什麼、為什麼這樣選擇。
從剛性到柔性的光譜
把這四種做法排在一起看,你會發現它們其實是一個光譜:
LangChain:完全用程式碼控制,最穩定,但最沒彈性。
工作流:用圖形化的方式設計流程,上手門檻低一些,但本質一樣是固定流程。
技能包:給大語工作手冊和工具箱,讓他在一定範圍內自己判斷。有彈性,同時又不至於失控。
純智慧代理(Pure Agent):什麼都不預設,讓大語自己規劃流程、自己找工具。最有彈性,但也最不可控。
這四種做法各有適合的場景。流程越固定、越重複的任務,適合用越剛性的方式。流程越多變、需要判斷的任務,適合用越柔性的方式。
回頭看全貌
我們來回頭看一下。
你會發現,前面講的這些概念,做的事情歸根結底就兩件:
第一,幫大語補充他不知道的資訊。 上下文、記憶、網路搜尋、RAG、技能包,全部都是在做這件事。
第二,減少你跟大語之間的溝通次數。 智慧代理、函數調用、MCP、工作流,這些都是在做自動化,讓你不用每一步都親自盯著。
就這樣。所有看起來很複雜的概念,最後都回到這兩個目標。
而第一個目標「補充資訊」這件事,還有一個關鍵:資料不是越多越好。
提示詞太精簡,背景資訊給太少,很多事情交代不清楚,大語就自己腦補亂做。
但如果一口氣給太多呢?你叫他把公司這十年來的所有檔案全部看完,他頭也會昏,反而抓不到重點。
所以應該規劃一下:他現在在做什麼任務,就給他這個任務需要的資料就好。這樣他既能保持專注,又不會搞錯方向。
這件事,就是現在常說的「上下文工程」(Context Engineering)。前面講的上下文、記憶、RAG、技能包,全部都是上下文工程的一部分,都在處理同一個問題:怎麼在對的時間,給對的資訊。
那我們能做什麼?
大語的腦袋怎麼訓練,那是學校,也就是 OpenAI、Anthropic、Google 這些 AI 公司在做的。那些外部工具和連接介面,也都是現成的,就像公司裡的隨身碟、投影機一樣,我們沒辦法自己開發。
我們一般人,能做的就是兩件事:把參考資料整理好,把工作手冊寫清楚。
對應到 AI,就是把資料夾(知識庫)整理好,讓大語能找到正確的資料。然後把操作手冊(技能包)寫清楚,告訴他遇到什麼情況該怎麼處理、判斷標準是什麼。
其他的,我們只能等。等下一梯的大語變得更聰明,等硬體介面統一,就像 USB 慢慢都變成 USB-C,不用再搞一堆轉接器。這些是時代會自己更新的。
而整理資料、寫好技能包,是不會寫程式、不會訓練模型的一般人,最能做、也最值得做的事情。

概念對照表

我是江江教練
隱性知識提煉師、AI 應用規劃師
對 AI × 知識管理、隱性知識提煉有興趣?
歡迎加入我的 LINE 社群
https://line.me/R/ti/g2/V63_43ngbs_kq1mpVc9LlxXB-1kchHnwdsy3WQ
我每月固定舉辦兩場免費線上講座,分享實戰經驗與方法論。如果你對這些主題感興趣,想持續學習,或是有顧問需求,都歡迎先從社群開始。
主要討論:
🔸 善用 AI 作為思考夥伴,提升決策品質與思考深度。
🔸 把知識、經驗,整理成提示詞、技能包、知識庫,讓 AI 能靈活運用。







