Google DeepMind 發布 Genie 3：從文字生成可互動 3D 世界的新世代模型

2025/08/12 更新2025/08/12 發佈閱讀 4 分鐘

生成式 AI 已經能創作圖片、影片與音樂，但能否直接生成一個可探索、可互動的 3D 世界？Google DeepMind 在 2025 年 8 月 5 日發布的 Genie 3 正是這個方向的重要突破。它不只是視覺內容生成，而是提供了一個能「在世界中行動」的 AI 平台，為遊戲、教育、機器人訓練等領域開啟新可能。

Genie 3: A new frontier for world models

Genie 3 ：通用世界模型

Genie 3 是一款通用世界模型（world model），能從純文字提示即時生成可互動的 3D 環境，並以 720p、24fps 的規格保持數分鐘的場景一致性。相比 Genie 2 僅有 10–20 秒、360p 的短片生成能力，Genie 3 實現了可持續互動、可編排事件的重大提升：

Genie 3: A new frontier for world models

自回歸生成的挑戰與突破

Genie 3 採用自回歸生成逐幀產出畫面，必須即時考慮使用者過往行動，並在數秒內更新世界狀態。這對計算效率與模型記憶都是極大挑戰，尤其是當玩家在一分鐘後回到先前位置時，模型仍需呈現一致的場景。

Promptable World Events：互動性的擴展

此功能允許用戶以文字改變環境條件，例如在一片草原中加入熱氣球，或在歷史場景中添加新角色。對訓練 AI 代理而言，這大幅擴展了「假設場景」的覆蓋面，有助於測試 AI 在非預期情況下的反應。

模擬與代理訓練

Genie 3 已與 SIMA 代理結合測試，代理可以在這些世界中完成複合任務，例如從倉庫入口移動到特定物體。長時一致性意味著代理可完成更長序列的行動規劃，這對 AGI 的路線意義重大。

它將如何影響我們的生活與產業？

教育：教師可生成歷史場景或科學實驗環境，讓學生沉浸式學習。
遊戲：開發者能快速生成互動世界，降低美術與設計成本。
機器人與自駕訓練：提供多變的模擬場景，幫助 AI 適應現實世界的不確定性。

TN科技筆記的觀點

Genie 3 的長時一致性與即時互動性，意味著 AI 世界生成已從「看影片」進入「身歷其境」階段，對遊戲與教育的價值不容忽視。
高計算需求可能限制普及，且目前無法精確還原真實地理位置，複雜多代理互動仍是瓶頸。
若能結合語音、音效與多代理支援，這類模型不僅會重塑娛樂與學習，更可能成為未來 AI 代理的「虛擬地球」，推進 AGI 研究與應用落地。

支持TN科技筆記，與科技共同前行

我是TN科技筆記，如果喜歡這篇文章，歡迎留言、點選愛心、轉發給我支持鼓勵～～～也歡迎每個月請我喝杯咖啡，鼓勵我撰寫更多科技文章，一起跟著科技浪潮前進！！>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者們，讓我更加有動力為各位帶來科技新知！

TN科技筆記(TechNotes)的沙龍科技領域筆記

留言

TN科技筆記(TechNotes)的沙龍

70會員

233內容數

大家好，我是TN，喜歡分享科技領域相關資訊，希望各位不吝支持與交流！

TN科技筆記(TechNotes)的沙龍的其他內容

2025/08/09

OpenAI GPT-5 ：免費仔也能用！AI 正式進入「博士級」思考時代

2025 年 8 月 7 日，OpenAI 正式發布了萬眾矚目的 GPT-5。這不只是一次例行的更新，而是 OpenAI 宣稱的「我們迄今最聰明、最快、也最有用」的 AI 系統。執行長 Sam Altman 甚至比喻：如果 GPT-4 像個聰明的大學生，那 GPT-5 就具備了「博士級」的專業能力。

2025/08/09

OpenAI GPT-5 ：免費仔也能用！AI 正式進入「博士級」思考時代

2025/08/07

Anthropic 發佈 Claude Opus 4.1 ：專為「寫程式」而生的 AI 模型？

身為 OpenAI 主要競爭對手之一的 Anthropic，在 2025 年 8 月 6 日也發布了他們最新的模型更新：Claude Opus 4.1。這次的 4.1 版升級的重點鎖定在對專業人士重要的領域：程式碼撰寫、AI 代理人任務（Agentic Tasks）和深度推理。

2025/08/07

Anthropic 發佈 Claude Opus 4.1 ：專為「寫程式」而生的 AI 模型？

2025/08/06

OpenAI 推出開源模型 gpt-oss！開源模型領域進入新階段

2025 年 8 月 5 日，OpenAI 終於推出 gpt-oss-120b 和 gpt-oss-20b 兩款「開放權重 (Open-Weight)」模型。這是自 2019 年的 GPT-2 以來，OpenAI 首次重返開源領域。更關鍵的是，這次的 gpt-oss 模型不僅性能強悍，甚至能在高階

2025/08/06

OpenAI 推出開源模型 gpt-oss！開源模型領域進入新階段

#AI 的其他內容

Claude Cowork：我從零開始設計一個 5 人 Agent 幕僚團隊的思路

賴仕涵的思考王國

💖當「我的女朋友叫GEMINI」成為公開認同：台視【熱線追蹤】觀後感

小貝的多媒體學習日記．Beibei's diary

為什麼很多專業剪輯師不用剪映？剪映 vs Adobe Premiere Pro 差異

你可能也想看

哈斯的煉金工房

投資海外市場就選玉山證券！！玉山證券「小額債」體驗分享 ⛰️

對於害怕風險、擔心賠錢的投資新手，本文介紹債券投資的優勢，說明其風險相對可控、能定期領息的特性，並介紹玉山「小額債」如何以低門檻（1,000美元/澳幣起）提供投資者參與海外債市的機會，強調其低波動、固定收益的友善特點，適合有明確時間目標的資金規劃。

#理財#債券#報酬

2026/02/11

哈斯的煉金工房

投資海外市場就選玉山證券！！玉山證券「小額債」體驗分享 ⛰️

#理財#債券#報酬

2026/02/11

理財好好玩

【一位CFP的日常】打造穩定現金流，不必冒進：小額債的投資思維

本文深入探討債券投資的本質、常見迷思、風險控制方法，並詳細介紹玉山證券「小額債」平臺的特色與優勢，包括低門檻、24hr即時報價、精準篩選等，幫助投資人建立理性、有紀律的債券投資策略，打造穩定的現金流，讓金錢成為財務上的助力。

#CFP#投資#財務

2026/03/13

理財好好玩

【一位CFP的日常】打造穩定現金流，不必冒進：小額債的投資思維

#CFP#投資#財務

2026/03/13

黛•Adele的生活隨筆

自由工作者的理財筆記｜第一次嘗試小額債就上手，打造多元資產配置｜玉山證券小額債券

自由工作者收入不穩定，適合選擇穩健的小額債做資產配置。玉山證券小額債最低一千美金就能開始，支援 24 小時委託下單與即時報價，並提供多條件篩選找到適合的債券。本文分享我的操作體驗與為何小額債能成為自由工作者的安心配置。

#小額債#玉山證券#債券投資

2026/02/10

黛•Adele的生活隨筆

自由工作者的理財筆記｜第一次嘗試小額債就上手，打造多元資產配置｜玉山證券小額債券

#小額債#玉山證券#債券投資

2026/02/10

艾比小劇場

不用每天盯盤，也能讓資產慢慢長大

為什麼「小額債券」會成為越來越多人關注的選項？如果你跟我一樣，經歷過股市大漲的甜、也嚐過劇烈修正的苦，大概就會慢慢明白一件事—— 投資，不只是追求報酬，更是關於「穩定感」。很多投資新手一開始進市場，很容易把全部資金都丟進股票，漲的時候很快樂，跌的時候卻發現自己根本睡不好。這

2026/03/14

2026/03/14

AI的世界充滿了創新和潛力，涵蓋了許多領域，包括但不限於機器學習，自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的，既帶來了巨大的機遇，也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡，確保AI技術的應用能夠真正造福人類。

2024/07/14

2024/07/14

快速了解AI-- Google提供的免費AI線上課

2023年是AI元年，其實AI還分成不同類別，不過對我們工作和教育影響最大的AI類型是生成式AI，就像各位 Google 在2023年第四季推出了一系列共7堂「生成式 AI」課程，免費喔! 這7堂 Google 免費課程包括： • Introduction to Generative AI

2024/06/24

職場進修、不看盤理財--Jaya

快速了解AI-- Google提供的免費AI線上課

2024/06/24

EC3

【 AI繪圖使用心得】

什麼是ＡＩ？ Artificial Intellgent ㄧ個數位大腦電腦新物種模擬人類的腦神經整合２Ｄ與３Ｄ的繪圖視覺在Bing 裡面基本上分為這幾個類型: 逼真的３Ｄ動畫動畫虛擬人偶展示攝影可愛貼圖二為圖例電腦科幻虛擬人偶公司標誌卡通電影海

2024/06/17

2024/06/17

《【ITIS線上研討會】虛擬人應用趨勢與AI賦能的Web3》

隨著ChatGPT問世以來，AI持續在不同領域上發揮作用。虛擬人已能代理人類完成特定任務，是新興科技從工具擴展至落地應用服務的關鍵產物。透過觀察AI如何賦能Web3的發展，以及觀測各種國際創新應用案例，請參加此免費研討會，了解「虛擬人應用發展趨勢」和「從AI賦能Web3新興應用看發展趨勢」二個議題

#CHATGPT#WEB3#AI

2024/06/12

職場進修、不看盤理財--Jaya

《【ITIS線上研討會】虛擬人應用趨勢與AI賦能的Web3》

#CHATGPT#WEB3#AI

2024/06/12

探索者草原大會

白話美術與設計-AI的新工業革命，是工具還是趨勢？

AI技術的發展如日中天，但也引發了許多道德與創作者權益的議題。從初期到現在的變化，AI的發展對創作者而言是一大挑戰，無論是哪種AI使用者，AI的出現，不代表我們要放棄思考。

#創作#作者#關鍵字

2024/04/06

探索者草原大會

白話美術與設計-AI的新工業革命，是工具還是趨勢？

#創作#作者#關鍵字

2024/04/06

Homeless Cosmopolitans' 實驗沙龍

【科學科技一科燙手報 Mk.2】：Google新發表的開源AI模型Gemma | 燙手度4天

大部分的人都知道Open AI的ChatGPT，部份的人知道Perplexity一類的生成式AI模型，還有一些人知道Google研發的生成式AI模型：Gemini (意思是拉丁文的雙生)。但幾小時前開放給開發者及研究者的開源AI模型Gemma（意思是拉丁文珍貴的石頭）大概沒什麼知道，

#Gemma#Google#AI

2024/02/25

Homeless Cosmopolitans' 實驗沙龍

【科學科技一科燙手報 Mk.2】：Google新發表的開源AI模型Gemma | 燙手度4天

#Gemma#Google#AI

2024/02/25

ChoozSEO

生成式AI影像：開啟人工智慧新紀元

人工智慧（AI）的發展日新月異，其中生成式AI成為近年矚目的焦點之一。生成式AI不僅能夠模仿人類智能，更能夠創造全新的內容和想法。本文將深入探討生成式AI在影像領域的應用，包括其概念、原理、發展趨勢，以及一些嶄新的生成式AI公司和軟體。

2024/01/24

2024/01/24

生成式人工智慧（AI）已成為當前科技領域的一大熱點，其能力不僅限於模擬人類智能，更能在多種非傳統計算任務中創造前所未有的內容。這篇文章將深入探討生成式AI的理論基礎、實際應用、代碼實踐，以及其商業應用、工具和公司等方面，提供一個全面的視角來了解這一迅速發展的領域。

2024/01/23

2024/01/23

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News