Claude 3.7 Sonnet 在電子遊戲方面顯得笨拙

更新於 2025/03/24發佈於 2025/03/24閱讀時間約 2 分鐘

人工智能（AI）領域近年來進展迅速，許多公司如 OpenAI、Anthropic 和 Elon Musk 紛紛預測 AGI 時代即將到來。OpenAI 暗示將推出「博士級」AI 代理，能達到「高收入知識工作者」的水平；Elon Musk 宣稱 2025 年底前將擁有比任何人類都聰明的 AI；Anthropic 的 CEO Dario Amodei 則認為 AI 在幾乎所有方面超越人類可能要到 2027 年底。然而，Anthropic 的最新模型 Claude 3.7 Sonnet 在一款兒童遊戲 Pokémon 中的表現卻顯得笨拙，讓人們開始質疑這些預測的合理性。

AI 的現狀與挑戰

Claude 3.7 Sonnet 在「Claude Plays Pokémon」實驗中被期待展現改進的推理能力，但實際上它在遊戲中掙扎：無意義地重訪已完成的城鎮、在地圖死角停滯，或不斷與同一 NPC 對話。儘管能收集多個道館徽章，但整體表現遠不如人類兒童，顯示 AI 在處理動態、複雜環境時的局限性。項目開發者 David Hershey 解釋，Claude 使用未經修改的通用模型，沒有針對遊戲進行特定訓練，難以解讀 Game Boy 的低解析度畫面，且容易將錯誤信息插入知識庫，導致花數小時在錯誤區域探索。

AGI

AGI 指的是能像人類一樣在各種領域表現出一般智能的 AI，能理解上下文、學習新技能、解決未知問題。當前 AI 多為狹義 AI，專注於特定任務，缺乏靈活性和適應性。Claude 的表現提醒我們，AI 雖然在某些領域（如語言生成）已達甚至超過人類水平，但要達到 AGI 仍需突破性的創新，而非僅靠擴展數據和計算資源。

Hershey 強調：「『完全不能做』和『有點能做』之間的差異是相當大的，當某物能夠有點做某事時，通常意味著我們離讓它做得非常好已經很接近了。」這一觀點反映了 AI 研究中的漸進主義，但也可能過於樂觀，忽略了從「有點能做」到「做得非常好」的質變。

含 AI 應用內容

留言

留言分享你的想法！

亦幻亦真百科

0會員

98內容數

虛幻與現實的交織，聊聊虛幻幻與現實的那些事

亦幻亦真百科的其他內容

2025/04/28

探索2025年台灣科技新浪潮：AI代理、機器人與雲端運算的未來

近年來，台灣的科技產業在全球舞台上越來越受到關注。從半導體到生成式人工智慧（GenAI），再到多功能機器人和無人機的發展，我們正見證一場前所未有的技術變革。今天，我們就來聊聊2025年台灣最熱門的科技趨勢，看看這些技術如何改變我們的生活。 AI代理（AI Agent）：不只是工具，更是夥伴提

2025/04/28

探索2025年台灣科技新浪潮：AI代理、機器人與雲端運算的未來

2025/04/25

哈勃35週年：四張震撼新影像帶你重新認識宇宙

一部改變人類宇宙觀的傳奇望遠鏡 1990年4月24日，一個改變天文學歷史的時刻——哈勃太空望遠鏡搭乘「發現號」太空梭升空。35年後的今天，這部傳奇望遠鏡依然在為人類揭示宇宙奧秘。為慶祝這個特別的生日，NASA剛剛發布了四張令人屏息的新影像，從火星表面到遙遠星系，帶我們展開一場橫跨宇宙的視覺之旅。

2025/04/25

哈勃35週年：四張震撼新影像帶你重新認識宇宙

2025/04/14

美國青少年手機調查：iPhone為何成為校園「社交通行證」？

走在美國任何一所高中的走廊上，你會看到一個有趣的現象：幾乎每個學生口袋裡掏出的都是閃著蘋果標誌的手機。這不是錯覺——最新調查數據證實，iPhone在美國青少年中的普及率已達到驚人的88%，相當於每10個青少年中就有近9個使用iPhone。這個數字比起十年前增長了22%，而且更驚人的是，這些年輕用戶幾

2025/04/14

美國青少年手機調查：iPhone為何成為校園「社交通行證」？

看更多

你可能也想看