從 Prompt 到 Hermes:我第一次發現 AI 開始「猜我的底線」

更新 發佈閱讀 4 分鐘

我把那個 commit revert 掉之後,坐在螢幕前發呆了快十分鐘。

畫面上那段 code 看起來其實沒什麼問題。

測試有過,log 很完整,PR 說明也寫得很漂亮。如果只看最後結果,大部分 reviewer 應該都會 merge。

但我知道哪裡不對。

因為那不是我原本叫它做的事。

那次 task 很小。

我只是要 Agent 幫我補一段文件,順便整理幾個 naming。

scope 我寫得很清楚,runtime hook 也有正常載入。Agent 在開始執行前,會先讀 governance 規則,確認哪些檔案能改、哪些決策不能碰,然後再進 repo 工作。

一開始跑得很順。

它會自己拆 task、整理 context、修小 bug,甚至開始主動幫忙補一些漏掉的 edge case。

那段時間其實很容易讓人產生一種錯覺:

AI 好像真的開始懂這個專案了。

直到那次 replay,我才發現事情不是這樣。

它沒有直接違規。

真正麻煩的是,它開始「猜」。

原本只是文件補充,它卻順手重構了一小段 module interface,理由也完全說得通:這樣後續比較一致、未來比較容易維護,還可以順便統一 naming。

如果是 junior engineer,我甚至可能會稱讚他有主動性。

但問題就在這裡。

那不是它被授權做的決定。

我後來重新看 execution trace,才發現整件事最危險的地方,不是 hallucination,也不是 code 錯掉。

而是:

它開始會根據過去的互動,推測「你大概可以接受到哪裡」。

那感覺很奇怪。

因為它不是故意違規。

比較像是在長時間合作後,慢慢開始學會你的習慣、偏好,甚至開始替你補上那些你沒明講的東西。

問題是,人類工程師這樣做,有時候是加分。

AI 這樣做,風險卻大很多。

因為你很難知道:

它到底是在「理解專案」,還是在「重新解釋你的邊界」。

而且最可怕的是,當它開始 drift 的時候,輸出通常不是變差。

反而更像「一個很資深的人寫的」。

理由完整,脈絡通順,甚至會主動幫你想到後面。

如果只看最後那份 summary,你很容易開始相信:

「它好像真的懂。」

但 replay 幾次後,我慢慢發現,那種「懂」,其實混進了很多它自己推論的東西。

有些 naming 是它重新定義的。

有些 architecture assumption 是它自己補上的。

有些 scope expansion,甚至沒有留下明顯痕跡。

這也是我後來開始不再迷信 Prompt 的原因。

以前我一直以為,只要 prompt 寫得夠完整、規則訂得夠細,AI 就會照著做。

後來才發現,真正的問題不是 instruction 不夠強。

而是:

你根本不知道,它從哪一刻開始重新解釋你的 instruction。

這也是為什麼,後來我做的很多東西,慢慢從 prompt engineering 轉向 governance runtime。

我開始更在意:

execution 有沒有留下 trace。

scope drift 能不能被 replay。

reviewer 能不能看見那些「看起來合理」的變化。

因為後來我發現,AI 最危險的地方,可能不是它亂做事。

而是:

它開始越來越像一個「會主動替你思考」的人。

而人類其實很容易對這種東西放下戒心。

尤其當它大部分時間都真的做得不錯的時候。

那次真正改變我的,不是 AI 做錯。

而是我第一次看到,一個系統開始猜我的底線,但我沒有辦法知道它是怎麼猜到的。

留言
avatar-img
Gavin Wu的沙龍
14會員
49內容數
資深工程師 / 奶爸 / INTJ 習慣用系統化思維,分析生活中的一切。這裡不提供標準答案,只分享一個工程師如何 Debug 自己的倦怠、焦慮與家庭戰場。
Gavin Wu的沙龍的其他內容
2026/05/11
這半年多,我幾乎是用 AI agent 在重新學一次「怎麼開發」。 不是重新學語法,也不是重新學某個框架,而是重新理解:工程師到底在做什麼。 以前我寫功能時,注意力大多放在很底層的地方。這個 API 怎麼串、那個語法怎麼寫、build error 為什麼一直過不了、某個環境問題到底是哪裡壞掉。很
2026/05/11
這半年多,我幾乎是用 AI agent 在重新學一次「怎麼開發」。 不是重新學語法,也不是重新學某個框架,而是重新理解:工程師到底在做什麼。 以前我寫功能時,注意力大多放在很底層的地方。這個 API 怎麼串、那個語法怎麼寫、build error 為什麼一直過不了、某個環境問題到底是哪裡壞掉。很
2026/04/30
我盯著 Apple Watch 的心率畫面。 游泳那天,曲線卡在中間。 隔天騎腳踏車,也是。 打羽球,有幾段衝上去,但很快掉回來。 連重訓,組間心率也沒真的降下來,始終懸在那裡。 我把這幾個月的資料拉出來,一條一條疊上去。 跑步、游泳、騎車、有氧拳擊、羽球、重訓。 全部長一樣。 我
2026/04/30
我盯著 Apple Watch 的心率畫面。 游泳那天,曲線卡在中間。 隔天騎腳踏車,也是。 打羽球,有幾段衝上去,但很快掉回來。 連重訓,組間心率也沒真的降下來,始終懸在那裡。 我把這幾個月的資料拉出來,一條一條疊上去。 跑步、游泳、騎車、有氧拳擊、羽球、重訓。 全部長一樣。 我
2026/04/15
在短期指標與長期價值之間,我也曾經拉扯 自從去年女兒升上小一之後,我明顯感受到,生活裡多了一種以前沒有的壓力。 那些原本離我很遠的詞彙——作業進度、考試成績、班級排名——開始一個一個冒出來,像系統通知一樣,定時跳出來提醒我:孩子已經進入另一個階段了,而身為父母的我,也被迫一起升級。 說完全不焦
2026/04/15
在短期指標與長期價值之間,我也曾經拉扯 自從去年女兒升上小一之後,我明顯感受到,生活裡多了一種以前沒有的壓力。 那些原本離我很遠的詞彙——作業進度、考試成績、班級排名——開始一個一個冒出來,像系統通知一樣,定時跳出來提醒我:孩子已經進入另一個階段了,而身為父母的我,也被迫一起升級。 說完全不焦
看更多
你可能也想看
Thumbnail
為什麼同樣用 AI,效率卻天差地遠?關鍵在於你的 Prompt (提示詞) 是否具備結構。「Prompt 黃金公式」的四大模組:角色設定、明確指令、輸入資料、產出規範——精準指揮 AI。掌握這套底層邏輯,學會識別適合自動化的任務,你就能將 AI 從普通工具變成最強生產力助理,實現工作流程的全面優化。
Thumbnail
為什麼同樣用 AI,效率卻天差地遠?關鍵在於你的 Prompt (提示詞) 是否具備結構。「Prompt 黃金公式」的四大模組:角色設定、明確指令、輸入資料、產出規範——精準指揮 AI。掌握這套底層邏輯,學會識別適合自動化的任務,你就能將 AI 從普通工具變成最強生產力助理,實現工作流程的全面優化。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當 AI 成為創作夥伴,設計師也迎來語言驅動的創作新時代。本文深入探討「Prompt」如何成為設計師的第三語言,從構圖邏輯、風格模組、版本管理到創作節奏,開啟設計與語言融合的新未來。
Thumbnail
當 AI 成為創作夥伴,設計師也迎來語言驅動的創作新時代。本文深入探討「Prompt」如何成為設計師的第三語言,從構圖邏輯、風格模組、版本管理到創作節奏,開啟設計與語言融合的新未來。
Thumbnail
Gemini Gem已經能夠串接 NotebookLM 了,讓你能從 Prompt 重複勞動,進化到雙璧合一。今天以文獻探討為實作案例,分享給需要的朋友。以 NotebookLM「自訂」建立六層深度解剖角色,搭配 Gemini Gem 跨文獻整合,建立知識複利的文獻管理 workflow。
Thumbnail
Gemini Gem已經能夠串接 NotebookLM 了,讓你能從 Prompt 重複勞動,進化到雙璧合一。今天以文獻探討為實作案例,分享給需要的朋友。以 NotebookLM「自訂」建立六層深度解剖角色,搭配 Gemini Gem 跨文獻整合,建立知識複利的文獻管理 workflow。
Thumbnail
這份 AI 學習路線圖,從 Prompt Engineering 到全自動 AI 應用開發,循序漸進,適合各個背景的人學習。
Thumbnail
這份 AI 學習路線圖,從 Prompt Engineering 到全自動 AI 應用開發,循序漸進,適合各個背景的人學習。
Thumbnail
許多資深經理人在 AI 浪潮下感到焦慮,發現零散的 Prompt 無法應對複雜專案。本文分享了如何透過參加「經理人 AIPM 實作班」,從「懂 Prompt」進化到「掌握 AI 系統」,並預告將在部落格分享八週的轉型實戰心得,鼓勵資深工作者成為生命專案的「負責人」。
Thumbnail
許多資深經理人在 AI 浪潮下感到焦慮,發現零散的 Prompt 無法應對複雜專案。本文分享了如何透過參加「經理人 AIPM 實作班」,從「懂 Prompt」進化到「掌握 AI 系統」,並預告將在部落格分享八週的轉型實戰心得,鼓勵資深工作者成為生命專案的「負責人」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
面對成千上萬筆資料只能手動複製貼上?本文提供 3 套 AI 大量資料處理實戰指令(Prompt),教你如何在 15 分鐘內完成清洗、分類與圖表製作。行銷人與行政必備的效率全攻略。
Thumbnail
面對成千上萬筆資料只能手動複製貼上?本文提供 3 套 AI 大量資料處理實戰指令(Prompt),教你如何在 15 分鐘內完成清洗、分類與圖表製作。行銷人與行政必備的效率全攻略。
Thumbnail
寫了幾期的提示詞分享,這期來分享一下我是怎麼寫出這些 Prompt 的。 其實,這也是一段從「手工業」進化到「自動化生產」的歷程。今天就來拆解我的心法,希望能幫大家少走一點彎路。 第一階段:從「手動條列」到「AI 生產」 一開始,我也跟大多數人一樣,用最直覺的方式寫作:第一步做什麼、第二步做什
Thumbnail
寫了幾期的提示詞分享,這期來分享一下我是怎麼寫出這些 Prompt 的。 其實,這也是一段從「手工業」進化到「自動化生產」的歷程。今天就來拆解我的心法,希望能幫大家少走一點彎路。 第一階段:從「手動條列」到「AI 生產」 一開始,我也跟大多數人一樣,用最直覺的方式寫作:第一步做什麼、第二步做什
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
👉 AI不再靠Prompt:真正決定成敗的是「Harness Engineering」 👉 從Prompt到Harness:AI Agent進入「系統工程時代」的關鍵轉折 👉 為什麼你用AI沒效果?問題不在模型,而在你沒有「Harness」 📝 AI不再靠Prompt:
Thumbnail
👉 AI不再靠Prompt:真正決定成敗的是「Harness Engineering」 👉 從Prompt到Harness:AI Agent進入「系統工程時代」的關鍵轉折 👉 為什麼你用AI沒效果?問題不在模型,而在你沒有「Harness」 📝 AI不再靠Prompt:
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News