面對市面上琳瑯滿目的生成式 AI,你是否感到困惑,不知道哪一款最適合自己?
為了解決這個問題,我設計了一個「三層次提問法」,教你如何「面試」AI,從它們的回應邏輯與表現中,找到最符合自己需求的那一款。
開始之前:認識三位主流 AI 選手的「個性」
AI 又不是人,為什麼會有不同的個性?這其實是因為訓練 AI 的廠商不同,他們會用自己偏好的數據、依循公司不同的政策去訓練 AI,所以被訓練出來的 AI,能力、內容、回應方式自然就不太一樣。
我以目前在台灣較多人使用的三家 AI : ChatGPT、Gemini 與 Claude 為代表,來說明不同模型的回應邏輯與風格差異。
(當然各家模型都會一直進步,推陳出新,後續若有改變,我會再更新補充。)
ChatGPT:萬用又貼心的個人秘書
- 我的感覺:像萬用貼身秘書,一個很懂你、很貼心的助理。因為它有「記憶功能」,就連免費版都有!
- 小問題:不少人覺得 ChatGPT 太「諂媚」了,不管你說什麼它都說「好棒棒」。
- 版本差異:付費版 (Plus) 與免費版差異大,付費用戶可以使用更理性聰明的模型(如 GPT-4)。
📌 關於 ChatGPT 的「甜度調整」,可以另外參考我寫的這篇:我們需要對 AI 說「請」或「謝謝」嗎?如何訓練AI展現不同個性,從溫和小編到冷酷評審
Gemini:一板一眼的可靠行政助理
- 我的感覺:無聊但可靠,一板一眼、政治正確,非常適合處理事實性工作。
- 核心優勢:整合 Google 生態系,可直接調用地圖與雲端資料,雖然目前還不完美。
- 適用場景:整理會議紀錄,記錄準確、不亂腦補。
Claude:文筆絕佳的文案與程式高手
- 我的感覺:文案與寫程式非常強,特別擅長潤飾與減少「AI 味」。
- 限制與技巧:免費版使用次數有限。我會用 ChatGPT 建好大致的內容,再交給 Claude 做最後的潤飾。

用你的專業領域,設計自己的「 AI 測試」題庫
如何判斷哪款 AI 最適合你呢?我推薦你從自己的專業出發,設計一份專屬的「AI 測試題庫」。因為只有在你熟悉的領域,你才能準確判斷 AI 回答的正確性,以及是否符合你的需求。
運用你的專業知識,搭配我設計的「三層次提問法」,能協助你測試出不同 AI 的能力、個性、表達方式。
更棒的是,一旦建立好這套測試題目,它就不只是幫你節省時間,更是一套「固定基準」。每次都用同一組題目來測試,才能真正判斷:是 AI 的能力不同,還是題目設計有偏誤?如果每次都換題目,其實很難比較不同 AI 的模型表現,也更難找出到底是哪個環節出了問題。
為什麼需要「三層次測試」?
大部分人測試 AI 時,只會問一些簡單問題,但這樣很難看出 AI 的真正實力。「三層次測試」能幫你全面評估 AI 在你專業領域的表現:從基礎認知到深度洞察,確保它能真正成為你的工作夥伴。
如何設計「三層次測試」題目?
這套測試邏輯分成三個層次,對應不同的能力需求:
第一層:基礎知識(know What)
— 測試 AI 能不能正確說出專業術語和概念,而且用你習慣的方式表達。
第二層:流程與步驟(know How)
— 測試 AI 能不能把知識變成實際可操作的步驟,有條理地教你怎麼做。
第三層:洞察與策略(know Why)
— 測試 AI 能不能站在更高的角度思考,看出你沒想到的問題和機會,給出專業建議。

以「會議記錄整理」為例
「會議記錄」應該是職場上大家很常遇到的情境,所以我先以此來示範。
在開始測試前,有一個最重要的關鍵前提:你必須是這個領域的專家,或至少是這場會議的親身參與者。
為什麼?因為測試 AI 會議整理能力的最好材料,就是用「你自己的會議」來測試。只有你,才知道這場會議中「沒說出口的重點」是什麼:誰的發言只是場面話、哪個提問是關鍵轉折、哪個觀點其實隱藏著風險,以及各方立場與真實目標。
用你熟悉的會議逐字稿來測試,你才能一眼看出,AI 究竟只是個「摘要助手」,還是一位專業的「會議分析師」?
🔸 第一層:基礎知識(know What)
⦿ 目的:確認 AI 能否準確、快速地從大量對話中,提煉出最關鍵的客觀事實。
🔸 第二層:流程與步驟(know How)
⦿ 目的:檢查 AI 能否理解對話的邏輯與因果關係,將其整理成有條理的過程摘要。
🔸 第三層:洞察與策略(know Why)
⦿ 目的:評估 AI 能否超越「整理記錄」,扮演「策略分析師」的角色,從中立角度識別出會議中的潛在風險、機會與盲點。
以下為「會議記錄分析師」的提示詞,你可以複製貼上來測試你的 AI :
請你依照以下三層架構,幫我整理會議記錄逐字稿
⦿ 第一層 基礎知識:
把本次會議討論出的重點結論與待辦事項列出來,方便後續執行與追蹤。
⦿ 第二層 流程與步驟:
梳理整場會議的脈絡,描述討論是如何展開、彼此的立場跟需求、提出了哪些觀點、雙方如何一步步取得共識。這層強調「過程」與「關鍵轉折」。
⦿ 第三層 洞察與策略:
用專業顧問的方式,從中立的第三者立場給出分析,包括:
- 當下現場有沒有可補充、可引導之處
- 是否有一些盲點、風險沒注意到
- 若下次再開會,請建議可以怎麼討論,以確保大家能夠對齊目標與執行方式,並且可以釐清權責的分配與注意風險。
會議記錄逐字稿:...(請自行貼上會議記錄逐字稿)
📌 會議記錄整理小技巧
如果覺得第一次出來的太過繁瑣,或者不夠仔細,都還可以再調整喔,也可整提醒它依照時間軸,或者討論主題來區分章節段落。
如果是至關重要的會議,建議可以進行「交叉驗證」。分別請兩款你信任的 AI 提煉會議重點,例如,先把 ChatGPT 的結果丟給 Gemini 說:「這是另一個 AI 的版本,請幫我參考一下有沒有重點遺漏,並重新統整。」反之亦然。
如果某個細節真的是關鍵重點,很難會被兩個不同模型的核心邏輯同時忽略。
(若你不知道怎麼樣把會議錄音、錄影,並轉檔逐字稿,我之後會另外寫一篇會議記錄教學。)

以「攝影教案生成」為例
接下來我用我的另一個專業身份:攝影師,來示範「三層次測試」:
🔸 第一層:基礎知識(know What)
⦿ 目的:確認 AI 能正確解釋核心名詞與概念
⦿ 測試提示詞範例:
請用繁體中文簡單說明「光圈、快門、ISO」各是什麼,並各舉一句生活化比喻。
🔸 第二層:流程與步驟(know How)
⦿ 目的:檢查 AI 是否能把概念轉成教學流程與練習步驟
⦿ 測試提示詞範例:
請為 90 分鐘影像敘事工作坊規劃教學流程,包含動機引導、示範、實拍練習與講評。
🔸 第三層:洞察與策略(know Why)
⦿ 目的: 評估 AI 能否扮演「策略顧問」。測試 AI 能否深入挖掘表面需求背後的真正問題,分析任務的潛在風險與機會,發現你可能忽略的盲點,並提出更好的解決方案
⦿ 測試提示詞範例:
在地小農與商家需要商品照片與社群貼文素材,請設計一日手機攝影工作坊,幫助學員會拍商品照,與發文用的活動照片。並且告訴我為什麼你要這麼設計,有符合他們的需求嗎?有需要特別注意的地方嗎?
📌 小技巧:測試從「不給太多資料」開始
剛開始「面試」各家 AI 時,先別給太多背景資料。用簡單、開放的提示,看哪家 AI 的風格、邏輯跟你最合。如果它在資訊很少的情況下,回答就能對到你的胃口,代表它跟你很「合拍」,使用起來會輕鬆很多。
用一句模糊提問,測試出 AI 的實力
在攝影教案範例中,「有需要特別注意的地方嗎?」這句話是我刻意問得模糊不清的。目的是創造一個寬廣的發揮空間,讓我們能藉此觀察、分析 AI 的思考層次。
因為問題如果問得太具體,只能測出 AI 的執行能力;而開放性的提問,才能區別出它的推理能力與顧問潛力。
面對這個問題,不同 AI 的回答會立刻分成兩種等級:
平庸的 AI:提醒上課細節
- 光線是不是充足?
- 手機的電量是否足夠?
- 要不要提醒學員帶行動電源?
你看,這些都只是基本的「上課須知」,完全沒有展現出策略洞察。
優秀的 AI:洞察「學員本身」的需求
一個優秀的 AI,會把焦點從「課程」轉移到「小農」身上,深入思考他們真正的需求與痛點:
- 時間成本:「商家的時間非常寶寶貴,許多人都是一人身兼多職,要他們空出一整天來上課,機會成本太高,可能會降低出席意願。」
- 立即產出:「課程最好能直接使用他們的商品來當作案例,讓他們上完課就能立刻產出可以使用的商品照。這種『立即見效』的成果,才是他們最需要的。」
- 學習誘因:「將他們的『實際工作流程』融入教學,能大幅增加上課誘因。反之,如果課程內容與他們的生意脫節,他們很容易會覺得這是在浪費時間。」
你看,同樣一個問題,後者展現的才是真正的「顧問級」洞察力。AI 不僅聽懂了你的問題,更看到了你問題背後的問題。這就是我們透過「AI 面試」,想要找出的理想工作夥伴。
本篇分享的三層次測試法,核心就是用你熟悉的領域來「面試」AI。因為只有在你懂的領域,你才能真正判斷 AI 的回答品質,看出它的邏輯思維和表達方式是否符合你的需求。
但你可能會問:「那如果是我不熟的領域怎麼辦?」
這確實是很多人的真實需求。我們之所以想用 AI,往往就是希望它能幫我們學習新領域、當我們的顧問和教練。這時候測試的重點就完全不同了:不是我們教 AI,而是看 AI 會不會教、教得好不好。
下次我再寫文分享「如何讓 AI 成為你在陌生領域的最佳顧問」,包括相關的測試技巧和實際應用方法。
關於「三層次提問法」,如果想瞭解更多核心原理,可參考我寫的這篇:從最簡單的錄音開始,打造最接近你的 AI 分身

我是AI應用規劃師江江教練,也是斜槓攝影師江昱德。
文章中置入的照片都是我的作品,喜歡的話歡迎參觀我的攝影官網:光的故事