谷歌“游戏搭子”SIMA即将上线:通用AI智能体如何改变3D游戏?

閱讀時間約 4 分鐘

当地时间3月16日,谷歌DeepMind宣布推出“可扩展、可指导、多世界”的全新AI系统SIMA(Scalable Instructable Multiworld Agent),号称其是首个可以在广泛的3D虚拟环境和视频游戏中遵循自然语言指令的通用AI智能体。

据介绍,SIMA是一款训练、学习游戏技能的AI代理,可以遵从指令,在游戏里实时执行任务。对于从未玩过的游戏,甚至不具线性结束路径、开放世界的游戏,它也可以与玩家配合默契。

raw-image

简单来说,SIMA在游戏中不是一个“埋头苦干”的AI,更像“另一个玩家”。谷歌DeepMind研究员兼SIMA联合负责人Tim Harley表示:“SIMA并不是为了赢得比赛而训练的;而是为了赢得比赛而训练的。”

AIGC的“拓路者”

自OpenAI 2022年11月发布ChatGPT以来,微软、Adobe、Meta和Anthropic等一众科技企业纷纷推出自家AIGC工具。近期,该领域的开发已从文本写作延伸至图像、音视频和游戏领域。

谷歌方面称,视频游戏是AI系统的绝佳训练场。视频游戏作为一个沙盒,提供了一种安全、可访问的测试方法,不仅可以让AI学会玩游戏,还能够学会将抽象语言转化为实际行动,从而在各种环境中更加实用。

raw-image

目前,SIMA尚处于研究阶段。为了让SIMA接触到更多游戏环境,开发团队表示目前已与八家游戏工作室合作,在九款视频游戏上对其进行训练和测试。参与该项目的谷歌DeepMind研究工程师Frederic Besse表示:“SIMA能够利用游戏中的共享概念,学习更好的技能,并学会更好地执行指令。”

在游戏与AI领域,谷歌已算得上是“元老”级别。从早期与游戏平台Atari合作,到开发出以人类特级大师级别玩《星际争霸Ⅱ》的AlphaStar系统,SIMA的诞生标志着谷歌AI开发的全新里程碑

它主打从适用单一游戏转向通用、可指导的游戏代理,并具备理解自然语言指令和跨多种虚拟环境执行任务的超凡能力,这对于智能机器人和交互式AI系统的开发来说意义深远。

raw-image

真金不怕火炼

为使SIMA的学习和训练更为有效,DeepMind团队选择了更注重开放式游戏而非叙事的游戏,这类游戏以随机、自发为特点,可以在最大程度开发SIMA对于环境信息的获取范围。

并且,SIMA也不需要自定义API来玩游戏或访问源代码,仅凭屏幕图像和用户的简洁自然语言指令即可激活学习进度,从而提高SIMA的通用性。

开发团队还使用了4种研究环境,其中以Unity引擎创建了一个名为“Construction Lab”的新环境,代理需要在其中搭建模型,以测试其对对象操作和物理世界的理解程度。此外,研究人员还避免了具有暴力行为的游戏,以符合谷歌的AI道德准则

raw-image

数据层面,DeepMind团队收集了多种游戏操作中键盘和鼠标数据,再将该数据输入到机器人的语言模型中,通过消化庞大的文本数据库,SIMA的语言处理能力从而得到训练和强化。人类评审的评估结束后,SIMA根据人工数据对性能进行微调。

当前,SIMA已完成了对600项基本技能的评估,可实现10秒内导航、对象交互和菜单使用等操作,并适应各种场景。而即使是在未经训练过的游戏中,SIMA的表现也等同于训练过的智能体,证明了其在全新环境中的泛化能力。

raw-image

OpenAI概念延续

2016年,“游戏智能体”概念出现在大众视野。OpenAI推出的首版Universe平台在问世之后便得到了微软、英伟达等多家知名公司的支持,共同致力于让其像人类一样使用计算机。

据悉,Universe能够模拟各种游戏和应用程序,并允许用户训练、测试其在多种环境中的表现。在各种各样的仿真环境(包括Flash游戏、浏览器任务等)中,智能体可以通过观察屏幕像素、模拟键鼠操作等方式,与环境进行交互。通过该平台,研究人员可以以人类为算法性能基准,并在各种仿真环境中测试智能体的算法并比较它们的性能。

相比之下,SIMA为研究人员提供了一个灵活且可定制的平台,使其可以更加深入地探索该智能体的各个方面(如虚拟现实、游戏开发、智能助手等),展示了开发新一代通用、语言驱动AI智能体的潜力,为未来智能系统的发展开辟了新的可能性。

raw-image

#谷歌##人工智能##游戏##OpenAI#

    avatar-img
    1會員
    197內容數
    留言0
    查看全部
    avatar-img
    發表第一個留言支持創作者!
    TommyChueng的沙龍 的其他內容
    当地时间周三(3月13日),特斯拉股价下跌4.54%,至169.48美元,触及2024年新低,也是2023年5月以来的低点。
    3月13日,据媒体透露,有消费者反映,自己在元旦前选购的极氪007车型,在过完春节后却遇到了无法交付的问题。并且,该消费者所支付的5,000元定金也被极氪工作人员明确表示“不予退还”。
    3月12日,千呼万唤始出来,雷军在微博宣布,“3月28日,小米SU7正式发布,这是我们的三年之约。”小米汽车官方微博则称,上市即交付,交付即上量。
    当地时间3月7日,新加坡国会通过了《金融机构(杂项修正案)法案》(FIMA法案),赋予新加坡金管局(MAS)对金融业更为广泛的调查和监管权力。
    3月11日,日本内阁府公布了2023年第四季度实际GDP年化季环比终值,该数据录得0.4%,大幅低于预期的1.1%,但较初期公布的-0.4%大幅上修。日本也凭借该数据,暂时摆脱了技术性衰退。
    3月6日,京東集團發佈了2023年第四季度及全年業績,本文詳細介紹了京東的業績數據和財務情況以及未來發展計劃和挑戰。
    当地时间周三(3月13日),特斯拉股价下跌4.54%,至169.48美元,触及2024年新低,也是2023年5月以来的低点。
    3月13日,据媒体透露,有消费者反映,自己在元旦前选购的极氪007车型,在过完春节后却遇到了无法交付的问题。并且,该消费者所支付的5,000元定金也被极氪工作人员明确表示“不予退还”。
    3月12日,千呼万唤始出来,雷军在微博宣布,“3月28日,小米SU7正式发布,这是我们的三年之约。”小米汽车官方微博则称,上市即交付,交付即上量。
    当地时间3月7日,新加坡国会通过了《金融机构(杂项修正案)法案》(FIMA法案),赋予新加坡金管局(MAS)对金融业更为广泛的调查和监管权力。
    3月11日,日本内阁府公布了2023年第四季度实际GDP年化季环比终值,该数据录得0.4%,大幅低于预期的1.1%,但较初期公布的-0.4%大幅上修。日本也凭借该数据,暂时摆脱了技术性衰退。
    3月6日,京東集團發佈了2023年第四季度及全年業績,本文詳細介紹了京東的業績數據和財務情況以及未來發展計劃和挑戰。
    你可能也想看
    Google News 追蹤
    Thumbnail
    徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
    Thumbnail
    隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
    Thumbnail
    人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
    Thumbnail
    在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
    Thumbnail
    生成式人工智慧可以輸出文章、圖片、影片、音樂和簡報等內容,就連創建網站都不必學習程式碼。Websim.ai 是一個利用 AI 技術來創建網站的體驗平台,輸入簡單的文字即可生成互動式網站。目前開放免費使用,AI 會根據指令生成相應功能
    Thumbnail
    上週精選✦這篇文章是一份豐富的資訊,涵蓋了很多人工智慧相關的項目和新聞。包括了Figma Config 大會、Google 開源的Gemma 2、Claude 的更新等。此外還包含了各種產品推薦和重點研究。文章豐富而全面,充滿了最新的人工智慧相關資訊。
    Thumbnail
    什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
    Thumbnail
    本文介紹一個能將影片轉3D的AI工具,名為Luma AI。它能將影片或照片轉換成令人驚奇的3D圖像。文章介紹了Luma AI的願景、使用技術、使用方式、優缺點以及應用發想
    Thumbnail
    Meta Platforms 正在探索推出其人工智慧助理 Meta AI 的付費版本的可能性,因為它的目標是在快速發展的人工智慧市場中與其他科技巨頭競爭。該付費版本擁有潛在的高級功能,並將競爭能力提高到新的水平。
    Thumbnail
    Open AI影片生成模型Sora橫空出世 Sora是一個 AI 模型,可依據文字指令創建現實和富有想像的場景 這是Open AI首頁關於生成模型Sora的簡介 Open AI執行長將籌資數兆美元重塑全球半導體產業 全美娛樂產業接受訪談的300位主管,認為未來3年將有20萬個工作 受到AI
    Thumbnail
    這篇要講的圖像提示詞概念是在AI繪圖的過程中輸入圖片,讓AI去理解圖像內容,或是直接參考圖像的構圖或色彩,再產生新的圖片。 雖然我最常用的是文字提示詞的方式生圖,但是圖像提示詞的應用比文字提示詞更廣也更加複雜,尤其在生成影片的範疇。 即使OpenAI在近日發表了強大的文生影片的Sora模型,但畢
    Thumbnail
    AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
    Thumbnail
    徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
    Thumbnail
    隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
    Thumbnail
    人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
    Thumbnail
    在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
    Thumbnail
    生成式人工智慧可以輸出文章、圖片、影片、音樂和簡報等內容,就連創建網站都不必學習程式碼。Websim.ai 是一個利用 AI 技術來創建網站的體驗平台,輸入簡單的文字即可生成互動式網站。目前開放免費使用,AI 會根據指令生成相應功能
    Thumbnail
    上週精選✦這篇文章是一份豐富的資訊,涵蓋了很多人工智慧相關的項目和新聞。包括了Figma Config 大會、Google 開源的Gemma 2、Claude 的更新等。此外還包含了各種產品推薦和重點研究。文章豐富而全面,充滿了最新的人工智慧相關資訊。
    Thumbnail
    什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
    Thumbnail
    本文介紹一個能將影片轉3D的AI工具,名為Luma AI。它能將影片或照片轉換成令人驚奇的3D圖像。文章介紹了Luma AI的願景、使用技術、使用方式、優缺點以及應用發想
    Thumbnail
    Meta Platforms 正在探索推出其人工智慧助理 Meta AI 的付費版本的可能性,因為它的目標是在快速發展的人工智慧市場中與其他科技巨頭競爭。該付費版本擁有潛在的高級功能,並將競爭能力提高到新的水平。
    Thumbnail
    Open AI影片生成模型Sora橫空出世 Sora是一個 AI 模型,可依據文字指令創建現實和富有想像的場景 這是Open AI首頁關於生成模型Sora的簡介 Open AI執行長將籌資數兆美元重塑全球半導體產業 全美娛樂產業接受訪談的300位主管,認為未來3年將有20萬個工作 受到AI
    Thumbnail
    這篇要講的圖像提示詞概念是在AI繪圖的過程中輸入圖片,讓AI去理解圖像內容,或是直接參考圖像的構圖或色彩,再產生新的圖片。 雖然我最常用的是文字提示詞的方式生圖,但是圖像提示詞的應用比文字提示詞更廣也更加複雜,尤其在生成影片的範疇。 即使OpenAI在近日發表了強大的文生影片的Sora模型,但畢
    Thumbnail
    AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。