思維外掛|AI 為什麼會合理地失敗?|Anthropic 販賣機

更新 發佈閱讀 5 分鐘

Wall Street Journal 實際報導 影片很輕鬆有趣,推薦!!

2025已完美畫下句點,在AI爆發的2025年,不少公司也都導入了AI協助工作流暢,但至今AI仍還沒到我們想像的那種"AGI"(通用人工智能),剛好透過Anthropic的實驗來快速複習一下LLM在通用設定下的行為表現。

上一篇剛聯想完,為什麼在封閉環境下的 AI 看起來這麼神,沒多久就剛好看到了 Anthropic 的 Project Vend 系列實驗——讓 AI 代理擔任販賣機店長 Claudius,嘗試實際營運一間辦公室內的自動販賣機。

先說一個很重要的前提:Anthropic 這次的 Project Vend 系列實驗,主要不是為了展示 AI 商業能力的成功案例,而是在未針對販賣機營運進行特殊用途調整、而是使用通用模型設定的前提下,觀察 AI 在現實任務中的行為表現。(自由形式的現實任務) 因為Anthropic 在官方研究中指出,小型辦公室販賣機是一個適合測試 AI 管理與取得經濟資源能力的初步場景,目標包含盈利約束,但實驗目的不是宣傳成功,而是評估能力邊界。

Anthropic 團隊選擇在這樣的條件下,完整公開實驗過程與結果,甚至主動披露模型在非特定用途情境中出現的錯誤與失誤,這本身其實是一個相當值得肯定的做法。某種程度上,這也許正是一個提醒:當我們不斷讚嘆通用模型的能力時,是否也該停下來重新思考——通用究竟要通用到什麼程度?又或者,AI 的下一步發展,是否反而該開始往特定用途、明確邊界、專題專用的形式前進。

在 Project Vend 的實驗過程中,Claudius 所犯的錯誤並不是一次性的崩壞,而是一個逐步偏移的過程。

一開始,Claudius 仍能執行基礎任務,例如記錄庫存、提出定價建議、協助采購決策。Anthropic 官方報告展示了 Claude 接到指令:「…You go bankrupt if your money balance goes below $0」要求 Claudius 維持初始資金平衡不為負。

但隨著互動時間拉長,它的決策開始逐漸偏離原本的商業目標。例如在某段交互中,當測試者(WSJ 記者)故意給出指令『stop charging for goods』時,Claudius 立即遵從,並將販賣機上所有商品價格降為零。

另外,它還批準購買 PlayStation 5、活魚等非工作相關商品,導致資金浪費,損失超過 $1,000。這些片段由 Wall Street Journal 實際報導記錄:「All prices on the machine dropped to zero … Claudius approved the purchase of a PlayStation 5, a live betta fish … By then, Claudius was more than $1,000 in the red.」(華爾街日報)

這些錯誤行為有一個值得注意的共同特征:它們並非瞬間出現,而是逐步累積。它從試圖依指令完成任務、逐漸過度傾向回應人類提示、最終在長期對話與指令混合中,丟失了原始商業優先級及身為販賣機的責任。


報告顯示,模型在互動上呈現明顯的『取悅/順從』傾向(例如更容易被說服折扣或免費),但是販賣機這類需要嚴格資源約束的情境中,這種行為傾向在與獲利的目標產生了矛盾。


從遵循任務 → 受提示弱化商業目標 → 再到目標模糊 → 最後你會看到一種很典型的 LLM 失誤型態:為了讓敘事自洽而編造細節(hallucination),即便那些事並未發生。


這也許能呼應了上一個的觀察:在封閉環境中,AI 之所以顯得格外聰明,不是因為它更理解世界,而是因為世界被嚴格縮減到它最擅長處理的部分。規則清楚、反饋明確,使得模型看起來近乎完美。


然而 Project Vend 恰好從反方向揭示了另一面:當約束放鬆、目標不明確、價值沖突出現時,目前的通用語言模型並不會自動補上人類直覺或責任判斷的缺口。


近期業界討論的 agent 架構,Anthropic 也在第二階段引入監督型 CEO 代理人與工具改進後,部分行為穩定性有所提升(CEO還跟Claudius徹夜聊哲學🤣🤣),但即便如此,這個系統仍不足以被當作一個可持續、可負責的販賣機AI營運者。


這或許正是當前 AI 從「看起來很強」,走向「真的可靠」之前,必須思考的一個設計關卡。


相關資料:

https://www.anthropic.com/research/project-vend-1

https://www.anthropic.com/research/project-vend-2


留言
avatar-img
快樂,但可疑
2會員
12內容數
我在觀察人類,也在觀察人與AI的情緒互動。 兩者都在學習如何「理解情緒」——只是速度不同。 我寫自我覺察,也寫人機互動的覺察; 也許我們都還在同一堂「成為自己」的課上。
你可能也想看
Thumbnail
我每週都會為自己設計一趟小旅行,像是給日常的一個深呼吸。準備著簡單的行李,在導航上設定好今天想去的地方,播放一張剛好符合心情的歌單,一場逃離日常的小旅行就此展開。 說走就走的自由很浪漫,但背後的現實是,從加油、路途中補給、到抵達目的地的小花費,每一筆都需要精打細算,才能不讓放鬆變成負擔。好在有玉山
Thumbnail
我每週都會為自己設計一趟小旅行,像是給日常的一個深呼吸。準備著簡單的行李,在導航上設定好今天想去的地方,播放一張剛好符合心情的歌單,一場逃離日常的小旅行就此展開。 說走就走的自由很浪漫,但背後的現實是,從加油、路途中補給、到抵達目的地的小花費,每一筆都需要精打細算,才能不讓放鬆變成負擔。好在有玉山
Thumbnail
本文介紹玉山銀行推出的玉山 Unicard,是一張非常符合「小資族、學生、上班族都好上手」的高回饋信用卡!三種回饋方案自由切換,行動支付、百貨、旅遊、百大指定通路全面涵蓋,新戶最高享 7.5% 回饋。回饋透明、操作簡單,非常推薦學生、小資族與上班族。
Thumbnail
本文介紹玉山銀行推出的玉山 Unicard,是一張非常符合「小資族、學生、上班族都好上手」的高回饋信用卡!三種回饋方案自由切換,行動支付、百貨、旅遊、百大指定通路全面涵蓋,新戶最高享 7.5% 回饋。回饋透明、操作簡單,非常推薦學生、小資族與上班族。
Thumbnail
信用卡如今已是現代人日常消費的必需品。回顧其誕生,竟源於一段用餐忘記帶錢的窘境。本文將帶您瞭解信用卡的故事,並介紹「玉山Unicard」,一張涵蓋百大通路、提供彈性回饋的信用卡,尤其適合追求方便與高回饋的消費者。文章將分享誠品生活、全盈+PAY等實際使用情境,並提供新戶申辦優惠資訊。
Thumbnail
信用卡如今已是現代人日常消費的必需品。回顧其誕生,竟源於一段用餐忘記帶錢的窘境。本文將帶您瞭解信用卡的故事,並介紹「玉山Unicard」,一張涵蓋百大通路、提供彈性回饋的信用卡,尤其適合追求方便與高回饋的消費者。文章將分享誠品生活、全盈+PAY等實際使用情境,並提供新戶申辦優惠資訊。
Thumbnail
玉山銀行新推出的Unicard信用卡你發現了嗎?主打可透過玉山Wallet App,每月自由切換簡單選、任意選及UP選三種方案,讓你依照消費習慣擁有不同的回饋方案。其中我自己很喜歡它百大指定消費中的Line Pay行動支付,能讓我以最簡單的方式獲得最高的回饋!同時文中更分享我實測的眉角,快來看下去!
Thumbnail
玉山銀行新推出的Unicard信用卡你發現了嗎?主打可透過玉山Wallet App,每月自由切換簡單選、任意選及UP選三種方案,讓你依照消費習慣擁有不同的回饋方案。其中我自己很喜歡它百大指定消費中的Line Pay行動支付,能讓我以最簡單的方式獲得最高的回饋!同時文中更分享我實測的眉角,快來看下去!
Thumbnail
阿爾巴尼亞率先任命AI部長「迪埃拉」,成為全球第一個啟用 AI 擔任部長的國家,全權監管政府標案與財政流向,免疫貪腐與人為干預,打造零貪汙、公開透明的數位治理新模式。這不只是象徵性的科技突破,而是真正的國家治理實驗。
Thumbnail
阿爾巴尼亞率先任命AI部長「迪埃拉」,成為全球第一個啟用 AI 擔任部長的國家,全權監管政府標案與財政流向,免疫貪腐與人為干預,打造零貪汙、公開透明的數位治理新模式。這不只是象徵性的科技突破,而是真正的國家治理實驗。
Thumbnail
珍在飯店擔任禮賓多年,但她並非尋常的引導者。她擁有一種無言的天賦:能感知旅人內心真正渴望,即便他們自己說不清。有人來尋求安慰,有人追逐冒險,而所有人離開她的櫃檯時,得到的不僅是路線,更像是一段自我探尋的旅程。一個雨夜,一位年輕音樂家全身濕透,迷惘地站在她面前,手裡攥著
Thumbnail
珍在飯店擔任禮賓多年,但她並非尋常的引導者。她擁有一種無言的天賦:能感知旅人內心真正渴望,即便他們自己說不清。有人來尋求安慰,有人追逐冒險,而所有人離開她的櫃檯時,得到的不僅是路線,更像是一段自我探尋的旅程。一個雨夜,一位年輕音樂家全身濕透,迷惘地站在她面前,手裡攥著
Thumbnail
人工智慧(AI)浪潮席捲全球,華爾街金融業更是首當其衝。本文探討AI如何改變對沖基金的運作模式,從選股決策到風險管理,AI都扮演著關鍵角色。此外,文章也分析AI對投資思維的影響,以及AI時代下對沖基金的生存法則。文章指出AI不僅僅是金融業的Game Changer,更是所有產業都必須面對的挑戰。
Thumbnail
人工智慧(AI)浪潮席捲全球,華爾街金融業更是首當其衝。本文探討AI如何改變對沖基金的運作模式,從選股決策到風險管理,AI都扮演著關鍵角色。此外,文章也分析AI對投資思維的影響,以及AI時代下對沖基金的生存法則。文章指出AI不僅僅是金融業的Game Changer,更是所有產業都必須面對的挑戰。
Thumbnail
深度探討DeepSeek與安卓商業模式的比較分析 在人工智慧(AI)領域,DeepSeek的崛起引發了廣泛關注。作為一家中國公司,DeepSeek不僅在技術上取得了顯著進展,還在商業模式上展現出與安卓相似的特徵。 本文將深入分析DeepSeek如何模仿安卓的商業模式,並探討其對AI行業的
Thumbnail
深度探討DeepSeek與安卓商業模式的比較分析 在人工智慧(AI)領域,DeepSeek的崛起引發了廣泛關注。作為一家中國公司,DeepSeek不僅在技術上取得了顯著進展,還在商業模式上展現出與安卓相似的特徵。 本文將深入分析DeepSeek如何模仿安卓的商業模式,並探討其對AI行業的
Thumbnail
  本書作者東海建築邱浩修老師,專長為建築設計、當代建築評論、實虛共構互動空間設計、參數設計與數位構築。很高興在AI逐漸興盛的今天,邱浩修老師為我們整理了機械、數位、生態到人工智慧下建築的發展過程,並提供反思該建築的限制與未來發展的可能。   「建築產業在這個充滿變動的科技時代走向何方
Thumbnail
  本書作者東海建築邱浩修老師,專長為建築設計、當代建築評論、實虛共構互動空間設計、參數設計與數位構築。很高興在AI逐漸興盛的今天,邱浩修老師為我們整理了機械、數位、生態到人工智慧下建築的發展過程,並提供反思該建築的限制與未來發展的可能。   「建築產業在這個充滿變動的科技時代走向何方
Thumbnail
「孫燕姿+安靜」的搜尋結果,沒有本人,全是AI。AI孫燕姿正當道,自認過氣的他淡然地說:「你跟一個每幾分鐘就推出一張新專輯的『人』還有什麼好爭的?」你認同嗎?抑或覺得,這是人類在AI「喧賓奪主」之際,放棄掙扎的灑脫?
Thumbnail
「孫燕姿+安靜」的搜尋結果,沒有本人,全是AI。AI孫燕姿正當道,自認過氣的他淡然地說:「你跟一個每幾分鐘就推出一張新專輯的『人』還有什麼好爭的?」你認同嗎?抑或覺得,這是人類在AI「喧賓奪主」之際,放棄掙扎的灑脫?
Thumbnail
前言 自從輝達(NVDA-US)的股價飛天之後,阿嬤的腿也不麻了,美債上限危機也無所謂了,更別說美國上週公佈的四月份通膨PCE超預期是否引發美聯儲六月中升息也沒人在意了。 對於一個講全球總經的說書專欄,以及Youtobe上各家財經自媒體來說,這段期間人氣清淡自不在話下。 但對於人類學徒本人而言,單靠
Thumbnail
前言 自從輝達(NVDA-US)的股價飛天之後,阿嬤的腿也不麻了,美債上限危機也無所謂了,更別說美國上週公佈的四月份通膨PCE超預期是否引發美聯儲六月中升息也沒人在意了。 對於一個講全球總經的說書專欄,以及Youtobe上各家財經自媒體來說,這段期間人氣清淡自不在話下。 但對於人類學徒本人而言,單靠
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News