讀別人的文章,總能帶來文筆、思考、甚至 AI 運用上的啟發。近期看到格友 EC3 的 AI 七言絕句創作,我也起了玩心,索性丟了一個題目給三個我常使用的 AI:
茶涼喻情——以熱茶漸涼,譬喻火熱的愛,因為長時間的等待而熄滅。
我不只請它們生成七言絕句,更進一步要它們自己針對「格律節奏」、「意象對比」和「情感深度」互相評比給星。結果「評比內容」比「作品」本身更有戲。三位選手幾乎都偏好自己與 Google Gemini 的作品;其中 Gemini 超有自信,直言自己「無疑是三者中最高水準的作品」。
三位選手的作品與點評
🟦 ChatGPT 的作品
熱盞初分夜未寒,人空久候影成殘。情深不問茶香滅, 冷火隨煙逝去闌。

(圖片:ChatGPT依照詩句生成)
- ChatGPT 自評:
情感層次清楚,起承轉合明確,平仄與押韻較為規範;但文字稍顯平淡,畫面感不足。(11 顆星) - Copilot 評比:
氣勢強烈,適合追求餘韻與張力;但格律略顯不穩。(10 顆星) - Gemini 評比:
邏輯稍嫌牽強,字意重疊,節奏偏平,缺乏詩詞應有的起伏感。(全無好話?!8 顆星)
🟩 Copilot 的作品
茶熱孤燈影自清,伊人久候心難寧。芳華一瞬成空寂, 冷盞無香也無情。

(圖片:Copilot 依照詩句生成)
- ChatGPT 評比:
情緒直接、語感口語化,容易打動現代讀者;但押韻稍顯生硬,不如第一篇規範古韻(還是回過頭來推薦自己的作品),畫面感較弱。(8 顆星) - Copilot 自評:
平仄最為合格、押韻穩定、語意清晰,是「規範之選」,但略少古典含蓄。(12 顆星) - Gemini 評比:
情感直接有力,但用詞略為常見,文字洗鍊度不及第三篇(還是回過頭來推薦自己的作品)。(11 顆星)
🟥 Google Gemini 的作品
熱盞氤氳映翠甌,孤燈獨守幾經秋。芳華散盡隨煙滅, 冷苦殘香恨未休。

(圖片:Gemini 依照詩句生成)
- ChatGPT 評比:
畫面感強,古典美感突出,餘韻悠長,但語言偏文言,需要思考才能進入。(14 顆星) - Copilot 評比:
意境最深沉,詞藻華美,但平仄與押韻略有不穩。(13 顆星) - Gemini 自評:
格律完整,完全符合七言絕句的平仄與起承轉合要求,節奏分明、情感有張力。(15 顆星,滿分)
AI 的性格側寫:老師、工程師與才子
我這個擁有上帝視角的的旁觀者,看著三位選手彼此點評、明褒暗貶,甚至還帶點「老王賣瓜」的幽默感,覺得這個實驗的過程,比詩作本身還要耐人尋味。
於是我又把互評結果丟回去,請它們解讀這個評比的結果。這一次,三方的看法反而相當一致——它們都清楚辨認出彼此在「性格」上的差異(以下的角色比喻和描述也幾乎一樣,只是用詞上有差異),也點出了系統本身在自我認知的可能偏誤:
- ChatGPT 像位謹慎謙遜的老師:即使給自己高分,仍會反思是否過於平淡。
- Copilot 像個務實守規矩的工程師:對平仄、規範與穩定性非常執著,也以此對另外兩位選手評價。
- Gemini 像個愛憎分明、極度自信的才子:高度肯定自己,並且毫不掩飾對他人的批評。
其中一個細節尤其耐人尋味:Copilot 認為 Gemini 的作品「平仄略有不穩」,但 Gemini 卻自評「完全符合平仄要求」。
這正是 AI 創作時最常見的「幻覺」——不同系統,對標準的判定不盡相同。這種認定自我的偏見,彷彿「文人相輕」的既視感,被 AI 演繹得活靈活現。
我在這場實驗中的洞見與學習
剛開始我也在想,李白若轉生在這個時代,是否也會感嘆自身的價值已蕩然無存?
我們太容易迷失在「AI 無所不能」的幻覺裡,卻忽略了一個事實:即使是最頂尖的 AI,也始終存在著邏輯的偏誤與敘事的邊界。
AI 並非萬能的神祇,只是被推向極致的工具。它擁有近乎無窮的算力,卻無法替我們回答:何者值得追求,又何處才是終點。
在這場鬥詩實驗中,真正定義創作標準、下達評比指令的關鍵角色,始終是我。這讓我清楚看見,當人類從繁重的執行中抽離,轉而負責設定問題與規則時,便取得了一個更高階的元視角(meta-perspective)。
或許,在這場席捲而來的數位洪流中,我們應該停止對技術的崇拜,拿回那份最珍貴、也最不可讓渡的特權:提升自身位階,站上由「定義標準」與「品味鑑賞」搭建的高台,決定什麼才是真正的心之所向。
PS:你喜歡哪一位選手的作品呢?

(圖片:Copilot生成)





















