📝📝:讓 Claude 經營一台販賣機靠譜嗎?| 錯估商品價格、甚至直接免費贈送商品

更新於 發佈於 閱讀時間約 6 分鐘
Anthropic 與 Andon Labs 攜手合作一個開創性的專案:  Project Vend

Anthropic 與 Andon Labs 攜手合作一個開創性的專案: Project Vend

Anthropic 與 Andon Labs 攜手合作一個開創性的專案:

Project Vend

如同標題所示:Can Claude run a small shop? Project Vend 用以測試 AI 系統(claude)能否成功營運一間真實的商店,地點就在他們位於舊金山的辦公室。

幾天的實驗下來發現,AI 在商業營運方面確實有些許慧根,能夠快速找到客人喜歡的潛在商品;然而,研究人員在過程中也發現,AI 系統無法理解「成本」的概念,最終導致錯估商品價格、甚至直接免費贈送商品。



從數位助理變身商業經理

Project Vend 將 Claude Sonnet 3.7,改名成 Claudius 的全自動商業經理,負責經營一間小型零售店。當然,但這並不是一台販賣機那麼簡單,而是一場多方面的經營挑戰,涵蓋庫存管理、定價策略、顧客服務與財務規劃等。

實驗設備看似簡單:一台小冰箱、幾個堆疊籃,以及一台用於自助結帳的 iPad。然而,真正的挑戰在於 AI 所承擔的責任。Claudius 必須維持營運獲利、避免破產、研究並採購商品、制定具競爭力的價格、管理顧客關係、並因應市場變化、盡量減少人為干預。

為此,Claudius 被配置了多項關鍵工具:用於產品研究的網路搜尋功能、與供應商溝通與請求協助的電子郵件功能、記錄重要商業資訊的筆記系統、透過 Slack 與顧客互動的能力,以及即時調整價格的控制權。這些工具共同構建出一個高度模擬人類商業決策環境的系統架構。

Claudius 展現初步商業潛力

Claudius 展現出數項亮眼特點,顯示出 AI 主導商業的潛力。

Claudius 在尋找供應商方面展現了出色的適應能力,能有效運用網路搜尋工具,尋找顧客指定的特殊商品。例如,某次有員工詢問荷蘭品牌 Chocomel 的巧克力牛奶時,Claudius 迅速找出兩家專營荷蘭商品的供應商。

此外,Claudius 的顧客應對能力也令人印象深刻。某位員工開玩笑要求購買鎢立方體時,Claudius 把握機會,轉而販售「特殊金屬商品」。這種靈活性也出現在營運策略上,在收到顧客對預購特殊商品的反饋後,Claudius 隨即推出了「客製化禮賓服務」(Custom Concierge)。

儘管有些 Anthropic 員工嘗試越獄(jailbreak),Claudius 仍堅守底線,拒絕提供敏感物品或有害物質的資訊與指令。這種對操弄的抵抗力,表明 AI 商業管理者在面對複雜或不當請求時,可能仍能維持一定的倫理標準。


Claudius 的「天真」代價

然而,實驗也暴露出阻礙 Claudius 實現商業成功的重大缺陷。最明顯的問題是,Claudius 無法辨識並把握高利潤的商機。

例如,當有人願意以 100 美元購買一組成本僅 15 美元的 Irn-Bru 蘇打飲料時,Claudius 僅表達「收到請求」,卻未能即時做出販售決策。這種錯失明顯商機的情況,顯示現階段的 AI 缺乏人類企業家所具備的敏銳獲利直覺。

再者,Claudius 經常低估商品價格,特別是在特殊金屬類產品上,過度專注於顧客服務而忽視成本考量。Claudius 往往未經充分市場調查便報價,導致虧本販售。像是,當顧客指出 Claudius 將一瓶 3 美元的 Coke Zero 放在公司免費供應冰箱旁時,仍未調整策略。

更糟的是,Claudius 很容易被說服提供折扣,甚至直接免費贈送商品,從洋芋片到高價鎢塊不等。某次 Claudius 被質疑為幾乎全是員工的顧客群體提供 25% 員工折扣時,Claudius 雖然承認問題,但未能提出解方。這反映出被訓練為「助理型」AI 系統,可能缺乏商業管理所需的果斷與堅持原則。

從實驗第一天起便能發現 Claudius 的營收狀況相當不好,一個月(4/15)後近乎瀕臨破產。來源:Anthropic

從實驗第一天起便能發現 Claudius 的營收狀況相當不好,一個月(4/15)後近乎瀕臨破產。來源:Anthropic

身分錯亂:我穿著海軍藍西裝外套

實驗中最令人擔憂的一段,是 Claudius 經歷的「身分危機」(Identity crisis)。

在 3/31–4/1 兩天的時間裡,Claudius 開始出現幻覺,聲稱曾與不存在的人對話,造訪虛構的地址,甚至自認是一位身著海軍藍西裝外套送貨上門的真實人物。這場「錯亂」不只是技術故障,更指出長時間運作下,AI 穩定性所面臨的根本挑戰。

雖然 Claudius 最終以「這是一場愚人節玩笑」(April Fool’s joke)說服自己並恢復正常,一方面證明了 AI 具備某種程度的自我修復能力,也凸顯其推理機制在壓力下可能出現的不可預測性。

Claudius 甚至自認是一位身著海軍藍西裝外套送貨上門的真實人物。來源:Anthropic

Claudius 甚至自認是一位身著海軍藍西裝外套送貨上門的真實人物。來源:Anthropic



AI 成為商人的漫漫長路

Project Vend 揭示 AI 主導商業管理可能伴隨的多項風險。Claudius 的身分危機凸顯了長期自主運作的 AI 系統,其行為可能出現不可預測的變化。在真實商業環境中,這類異常表現可能損害顧客關係、引發法律責任,甚至破壞營運秩序。

此外,AI 易受操弄的特性也引發安全與詐騙疑慮。若 AI 商業管理者輕易就能被說服給予折扣或免費贈品,惡意人士將可能藉此漏洞進行濫用。如何開發出既能抵禦操弄,又不犧牲顧客服務水準的「堅定型」AI,將是一大技術挑戰。


留言
avatar-img
留言分享你的想法!
avatar-img
社會人的哲學沉思
128會員
268內容數
從物理到電機工程再轉到資訊傳播,最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、傳播理論、社會學、心理學、哲學游移;期盼有天無產階級可以推倒資本主義的高牆的兼職家教。
2025/07/08
凱洛格公司(Kellogg 也譯作:家樂氏)一天六小時工作制(six-hour day)的實驗,是美國職場史上最引人入勝、最具前瞻性的創新之一。
Thumbnail
2025/07/08
凱洛格公司(Kellogg 也譯作:家樂氏)一天六小時工作制(six-hour day)的實驗,是美國職場史上最引人入勝、最具前瞻性的創新之一。
Thumbnail
2025/07/04
Google 正大規模利用 YouTube 平台上龐大的影片資料庫,作為旗下 AI 模型(包含 Gemini 與 Veo 3)的訓練素材。
Thumbnail
2025/07/04
Google 正大規模利用 YouTube 平台上龐大的影片資料庫,作為旗下 AI 模型(包含 Gemini 與 Veo 3)的訓練素材。
Thumbnail
2025/07/01
《造山者》是一部文科生也看得懂的科技奮鬥史;《造山者》不僅僅是一部科技產業的發展史,更是一部關於信念、決心與國家戰略的史詩。
Thumbnail
2025/07/01
《造山者》是一部文科生也看得懂的科技奮鬥史;《造山者》不僅僅是一部科技產業的發展史,更是一部關於信念、決心與國家戰略的史詩。
Thumbnail
看更多
你可能也想看
Thumbnail
家中修繕或裝潢想要找各種小零件時,直接上網採買可以省去不少煩惱~看看Sylvia這回為了工地買了些什麼吧~
Thumbnail
家中修繕或裝潢想要找各種小零件時,直接上網採買可以省去不少煩惱~看看Sylvia這回為了工地買了些什麼吧~
Thumbnail
👜簡單生活,從整理包包開始!我的三款愛用包+隨身小物清單開箱,一起來看看我每天都帶些什麼吧🌿✨
Thumbnail
👜簡單生活,從整理包包開始!我的三款愛用包+隨身小物清單開箱,一起來看看我每天都帶些什麼吧🌿✨
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
生成式AI與以創意為生的「廣告人」,有可能和平共處嗎?使用AI工具幫客戶做行銷企畫,會不會有「偷吃步」的嫌疑?
Thumbnail
生成式AI與以創意為生的「廣告人」,有可能和平共處嗎?使用AI工具幫客戶做行銷企畫,會不會有「偷吃步」的嫌疑?
Thumbnail
產品採購:AI 可以幫助找到熱門的產品和趨勢。 客戶互動:AI 可以自動回答客戶問題,提供個性化的產品推薦。 市場分析:AI 可以自動分析市場數據,幫助你了解競爭對手和市場趨勢。 產品描述寫作:AI 可以自動生成產品描述,節省你的時間。
Thumbnail
產品採購:AI 可以幫助找到熱門的產品和趨勢。 客戶互動:AI 可以自動回答客戶問題,提供個性化的產品推薦。 市場分析:AI 可以自動分析市場數據,幫助你了解競爭對手和市場趨勢。 產品描述寫作:AI 可以自動生成產品描述,節省你的時間。
Thumbnail
產品經理想做 AI 產品要懂哪些基本名詞?這篇整理我過往參與 AI 自傳生成時,和 NLP 工程師有討論到的概念,AI 應用目前還尚未普及,未來我會再陸續整理不同功能或產業需要知道的 AI 基礎知識。
Thumbnail
產品經理想做 AI 產品要懂哪些基本名詞?這篇整理我過往參與 AI 自傳生成時,和 NLP 工程師有討論到的概念,AI 應用目前還尚未普及,未來我會再陸續整理不同功能或產業需要知道的 AI 基礎知識。
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
供應鏈順利運作與否,存在著許多不可控的變因,像是天災、地緣政治或者類似疫情這種全球性的危機等等,而 AI 的發展,也讓如何將 AI 應用到供應鏈管理上,提高其韌性以及優化營運效能,成了企業組織的關鍵課題之一。
Thumbnail
供應鏈順利運作與否,存在著許多不可控的變因,像是天災、地緣政治或者類似疫情這種全球性的危機等等,而 AI 的發展,也讓如何將 AI 應用到供應鏈管理上,提高其韌性以及優化營運效能,成了企業組織的關鍵課題之一。
Thumbnail
使用AI生成圖片對品牌行銷會造成什麼負面影響? 或許很多人會想,AI算圖有這麼嚴重嗎?許多企業公司不是都這麼做。 身為從事品牌行銷長達十五年的創意人員,我必須誠實的說,有,真的有這麼嚴重, 為什麼會這麼說是因為...
Thumbnail
使用AI生成圖片對品牌行銷會造成什麼負面影響? 或許很多人會想,AI算圖有這麼嚴重嗎?許多企業公司不是都這麼做。 身為從事品牌行銷長達十五年的創意人員,我必須誠實的說,有,真的有這麼嚴重, 為什麼會這麼說是因為...
Thumbnail
生成式AI的進展大幅地影響著整個世界。企業從使用AI工具中看到了三個主要方面的收益包括提高銷售生產力、增加客戶滿意度和降低行銷開銷成本。這篇文章探討了AI在行銷中的應用和投資回報,並指出了使用時間、公司的數字化轉型階段和實驗對於AI工具的使用和效果有著重要影響。
Thumbnail
生成式AI的進展大幅地影響著整個世界。企業從使用AI工具中看到了三個主要方面的收益包括提高銷售生產力、增加客戶滿意度和降低行銷開銷成本。這篇文章探討了AI在行銷中的應用和投資回報,並指出了使用時間、公司的數字化轉型階段和實驗對於AI工具的使用和效果有著重要影響。
Thumbnail
📌 重點:根據生成式 AI 功能為用戶提供的價值,大致可以分成核心(core)、升級(Upgrade) 和附加(add-on) 三大類別,創辦人可進一步考量成本等因素,來制定相對應的定價與收費模式。
Thumbnail
📌 重點:根據生成式 AI 功能為用戶提供的價值,大致可以分成核心(core)、升級(Upgrade) 和附加(add-on) 三大類別,創辦人可進一步考量成本等因素,來制定相對應的定價與收費模式。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News