Claude 3.7 Sonnet 在電子遊戲方面顯得笨拙

更新於 發佈於 閱讀時間約 2 分鐘

人工智能(AI)領域近年來進展迅速,許多公司如 OpenAI、Anthropic 和 Elon Musk 紛紛預測 AGI 時代即將到來。OpenAI 暗示將推出「博士級」AI 代理,能達到「高收入知識工作者」的水平;Elon Musk 宣稱 2025 年底前將擁有比任何人類都聰明的 AI;Anthropic 的 CEO Dario Amodei 則認為 AI 在幾乎所有方面超越人類可能要到 2027 年底。然而,Anthropic 的最新模型 Claude 3.7 Sonnet 在一款兒童遊戲 Pokémon 中的表現卻顯得笨拙,讓人們開始質疑這些預測的合理性。

AI 的現狀與挑戰

Claude 3.7 Sonnet 在「Claude Plays Pokémon」實驗中被期待展現改進的推理能力,但實際上它在遊戲中掙扎:無意義地重訪已完成的城鎮、在地圖死角停滯,或不斷與同一 NPC 對話。儘管能收集多個道館徽章,但整體表現遠不如人類兒童,顯示 AI 在處理動態、複雜環境時的局限性。項目開發者 David Hershey 解釋,Claude 使用未經修改的通用模型,沒有針對遊戲進行特定訓練,難以解讀 Game Boy 的低解析度畫面,且容易將錯誤信息插入知識庫,導致花數小時在錯誤區域探索。

AGI

AGI 指的是能像人類一樣在各種領域表現出一般智能的 AI,能理解上下文、學習新技能、解決未知問題。當前 AI 多為狹義 AI,專注於特定任務,缺乏靈活性和適應性。Claude 的表現提醒我們,AI 雖然在某些領域(如語言生成)已達甚至超過人類水平,但要達到 AGI 仍需突破性的創新,而非僅靠擴展數據和計算資源。

Hershey 強調:「『完全不能做』和『有點能做』之間的差異是相當大的,當某物能夠有點做某事時,通常意味著我們離讓它做得非常好已經很接近了。」這一觀點反映了 AI 研究中的漸進主義,但也可能過於樂觀,忽略了從「有點能做」到「做得非常好」的質變。



留言
avatar-img
留言分享你的想法!
avatar-img
亦幻亦真百科
0會員
98內容數
虛幻與現實的交織,聊聊虛幻幻與現實的那些事
亦幻亦真百科的其他內容
2025/04/28
近年來,台灣的科技產業在全球舞台上越來越受到關注。從半導體到生成式人工智慧(GenAI),再到多功能機器人和無人機的發展,我們正見證一場前所未有的技術變革。今天,我們就來聊聊2025年台灣最熱門的科技趨勢,看看這些技術如何改變我們的生活。 AI代理(AI Agent):不只是工具,更是夥伴 提
2025/04/28
近年來,台灣的科技產業在全球舞台上越來越受到關注。從半導體到生成式人工智慧(GenAI),再到多功能機器人和無人機的發展,我們正見證一場前所未有的技術變革。今天,我們就來聊聊2025年台灣最熱門的科技趨勢,看看這些技術如何改變我們的生活。 AI代理(AI Agent):不只是工具,更是夥伴 提
2025/04/25
一部改變人類宇宙觀的傳奇望遠鏡 1990年4月24日,一個改變天文學歷史的時刻——哈勃太空望遠鏡搭乘「發現號」太空梭升空。35年後的今天,這部傳奇望遠鏡依然在為人類揭示宇宙奧秘。為慶祝這個特別的生日,NASA剛剛發布了四張令人屏息的新影像,從火星表面到遙遠星系,帶我們展開一場橫跨宇宙的視覺之旅。
2025/04/25
一部改變人類宇宙觀的傳奇望遠鏡 1990年4月24日,一個改變天文學歷史的時刻——哈勃太空望遠鏡搭乘「發現號」太空梭升空。35年後的今天,這部傳奇望遠鏡依然在為人類揭示宇宙奧秘。為慶祝這個特別的生日,NASA剛剛發布了四張令人屏息的新影像,從火星表面到遙遠星系,帶我們展開一場橫跨宇宙的視覺之旅。
2025/04/14
走在美國任何一所高中的走廊上,你會看到一個有趣的現象:幾乎每個學生口袋裡掏出的都是閃著蘋果標誌的手機。這不是錯覺——最新調查數據證實,iPhone在美國青少年中的普及率已達到驚人的88%,相當於每10個青少年中就有近9個使用iPhone。這個數字比起十年前增長了22%,而且更驚人的是,這些年輕用戶幾
2025/04/14
走在美國任何一所高中的走廊上,你會看到一個有趣的現象:幾乎每個學生口袋裡掏出的都是閃著蘋果標誌的手機。這不是錯覺——最新調查數據證實,iPhone在美國青少年中的普及率已達到驚人的88%,相當於每10個青少年中就有近9個使用iPhone。這個數字比起十年前增長了22%,而且更驚人的是,這些年輕用戶幾
看更多
你可能也想看
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
Anthropic AI推出的Claude 3.5 Sonnet NLP模型提供卓越性能和強大的功能。透過本文,您將瞭解到Claude 3.5 Sonnet的特點、費用、操作說明,並透過實作範例深入瞭解其在程式設計方面的能力。
Thumbnail
Anthropic AI推出的Claude 3.5 Sonnet NLP模型提供卓越性能和強大的功能。透過本文,您將瞭解到Claude 3.5 Sonnet的特點、費用、操作說明,並透過實作範例深入瞭解其在程式設計方面的能力。
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
人工智能(AI)是當今最熱門的話題之一,它正在改變人類的生活方式和 工作方式。踏入2023年,隨著 OpenAl 推出 ChatGPT 震驚全球,以 AI技術的應用程序不斷湧現,顛覆了 我們過去對科技的認知。 今天Only Two 翁立兔分享了這篇,我真的覺得蠻好的 【一天一千字,進化每一次】不
Thumbnail
人工智能(AI)是當今最熱門的話題之一,它正在改變人類的生活方式和 工作方式。踏入2023年,隨著 OpenAl 推出 ChatGPT 震驚全球,以 AI技術的應用程序不斷湧現,顛覆了 我們過去對科技的認知。 今天Only Two 翁立兔分享了這篇,我真的覺得蠻好的 【一天一千字,進化每一次】不
Thumbnail
英國金融時報週二報導,OpenAI全球事務副總裁Anna Makanju受訪時表示,OpenAI的使命是「打造等同人類現有認知能力」的AGI、而非超級智慧,AGI目前尚未誕生、在確保安全無虞之前不會發表。所謂的超級智慧是一種比人類聰明好幾倍的技術。
Thumbnail
英國金融時報週二報導,OpenAI全球事務副總裁Anna Makanju受訪時表示,OpenAI的使命是「打造等同人類現有認知能力」的AGI、而非超級智慧,AGI目前尚未誕生、在確保安全無虞之前不會發表。所謂的超級智慧是一種比人類聰明好幾倍的技術。
Thumbnail
Hi 我是 VK~ 這期我們來聊聊美國 AI 新創 Anthropic 的故事。他們當時為什麼會想要離開 OpenAI,決定出來創業?為什麼這麼在意 AI 安全性? 喜歡這期的內容,歡迎分享給朋友一起訂閱《VK 科技閱讀時間》,祝你今天一切順利~ 如果你平常有在用聊天機器人 Claude 翻
Thumbnail
Hi 我是 VK~ 這期我們來聊聊美國 AI 新創 Anthropic 的故事。他們當時為什麼會想要離開 OpenAI,決定出來創業?為什麼這麼在意 AI 安全性? 喜歡這期的內容,歡迎分享給朋友一起訂閱《VK 科技閱讀時間》,祝你今天一切順利~ 如果你平常有在用聊天機器人 Claude 翻
Thumbnail
人工智慧(AI)發展一日千里,年初OpenAI的Sora,三月初Anthropic的Cloude3,都為未來科技的創想帶來震撼。Elon Musk的X AI公司將他們的大型語言模型Grok-1開源,不僅展現了對AI技術開放共享的承諾,也預示著行業未來可能也會有不同於資本競爭、算力對抗的新發展方向。
Thumbnail
人工智慧(AI)發展一日千里,年初OpenAI的Sora,三月初Anthropic的Cloude3,都為未來科技的創想帶來震撼。Elon Musk的X AI公司將他們的大型語言模型Grok-1開源,不僅展現了對AI技術開放共享的承諾,也預示著行業未來可能也會有不同於資本競爭、算力對抗的新發展方向。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
人工智慧(AI)的未來展望 在當今這個科技日新月異的時代,人工智慧(AI)已成為推動創新和進步的重要力量。從自動駕駛汽車到精準醫療,AI的應用範圍不斷擴大,其潛力無限。然而,隨著AI技術的快速發展,我們也必須關注其對社會、經濟和倫理的影響。
Thumbnail
人工智慧(AI)的未來展望 在當今這個科技日新月異的時代,人工智慧(AI)已成為推動創新和進步的重要力量。從自動駕駛汽車到精準醫療,AI的應用範圍不斷擴大,其潛力無限。然而,隨著AI技術的快速發展,我們也必須關注其對社會、經濟和倫理的影響。
Thumbnail
Anthropic推出了新的Claude 3系列模型,號稱打敗OpenAI GPT-4與Google Gemini,成為地表最強的AI模型。文章介紹了Anthropic公司的核心理念、Claude 3模型家族與GPT-4 Gemini的比較。Claude 3模型在文字與圖像的理解能力都有大幅提升。
Thumbnail
Anthropic推出了新的Claude 3系列模型,號稱打敗OpenAI GPT-4與Google Gemini,成為地表最強的AI模型。文章介紹了Anthropic公司的核心理念、Claude 3模型家族與GPT-4 Gemini的比較。Claude 3模型在文字與圖像的理解能力都有大幅提升。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News