付費限定

Genie 3 是什麼?DeepMind 互動世界模型如何把「看影片」升級成「在世界裡做事」🚀

Mech muse 智慧新知-avatar-img
發佈於付費專區 個房間
更新 發佈閱讀 5 分鐘

你好,我是 Mech Muse。今天要用輕鬆的方式,打開 Google DeepMind「Genie 3」這扇通往互動宇宙的門。本文會帶你掌握:它到底跟影片生成模型差在哪、最有感的互動 Demo、從 Genie 1→3 的進化關節,以及它的應用前景、挑戰與與 AGI 的距離。背景脈絡先註明:2025 年 8 月 21 日,DeepMind YouTube Podcast 由 Shlomi FruchterJack Parker-Holder 親自解說這項技術。🗓️


Genie 3 的本質與與眾不同之處:為何它不是「更漂亮的影片」而是「即時可互動的世界」

Genie 3 是即時互動的世界模型(real-time interactive world model):你輸入文字、影像或影片作為提示,它就能逐格預測下一瞬的畫面,並對你的操作即時回應。相比之下,傳統影片模型(例如 V2)會一次性生成一段成品影片,你只能看,不能改變攝影機或路徑。

✨ 核心特點:

以行動支持創作者!付費即可解鎖
本篇內容共 1809 字、0 則留言,僅發佈於付費專區、AI人工智慧你目前無法檢視以下內容,可能因為尚未登入,或沒有該房間的查看權限。
留言
avatar-img
留言分享你的想法!
avatar-img
Mech muse 智慧新知
21會員
289內容數
27歲的剛畢業碩士生,所以創立這個部落格分享科技最新趨勢,目前寫人型機器人、AI人工智慧、小型核能SMR。透過文字與照片,我希望與你們一同暢想智能時代的可能性,歡迎加入這場科技之旅!
Mech muse 智慧新知的其他內容
2025/09/19
🚀 Nvidia 投資 Intel 50 億美金,開啟 CPU + GPU 整合新時代!本文將帶你了解這場矽片婚姻背後的動機、AI 運算的最大瓶頸、未來 x86 + RTX SOC 的潛力,以及這對黃綠聯盟將如何撼動資料中心與 AI PC 市場。💻⚡
Thumbnail
2025/09/19
🚀 Nvidia 投資 Intel 50 億美金,開啟 CPU + GPU 整合新時代!本文將帶你了解這場矽片婚姻背後的動機、AI 運算的最大瓶頸、未來 x86 + RTX SOC 的潛力,以及這對黃綠聯盟將如何撼動資料中心與 AI PC 市場。💻⚡
Thumbnail
2025/09/19
這篇文章帶你看懂 Google 在 2025 年 9 月 18 日公布的 Chrome 最大 AI 升級 🚀。從 Gemini 整合、多分頁整理、智慧搜尋,到防詐騙與一鍵改密碼,你將了解瀏覽器如何變成貼心小助理,幫你省時又更安全上網。
Thumbnail
2025/09/19
這篇文章帶你看懂 Google 在 2025 年 9 月 18 日公布的 Chrome 最大 AI 升級 🚀。從 Gemini 整合、多分頁整理、智慧搜尋,到防詐騙與一鍵改密碼,你將了解瀏覽器如何變成貼心小助理,幫你省時又更安全上網。
Thumbnail
2025/09/19
在 IFA2025,機器人不再只是展場花瓶,而是準備走進你家!從會爬樓梯的掃地機,到能讀懂情緒的機器狗,再到教你下棋的教育機器人,本篇帶你掌握最新趨勢與未來生活啟示。
Thumbnail
2025/09/19
在 IFA2025,機器人不再只是展場花瓶,而是準備走進你家!從會爬樓梯的掃地機,到能讀懂情緒的機器狗,再到教你下棋的教育機器人,本篇帶你掌握最新趨勢與未來生活啟示。
Thumbnail
看更多
你可能也想看
Thumbnail
本文探討了影像生成模型的多種應用,包括文字、圖像和聲音到影片的生成,涵蓋了GAN、Transformer和Diffusion等技術。透過回顧相關研究,分析影像生成技術的未來趨勢與挑戰,為讀者提供全面的理解與啟示。
Thumbnail
本文探討了影像生成模型的多種應用,包括文字、圖像和聲音到影片的生成,涵蓋了GAN、Transformer和Diffusion等技術。透過回顧相關研究,分析影像生成技術的未來趨勢與挑戰,為讀者提供全面的理解與啟示。
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
Thumbnail
AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
隨著ChatGPT問世以來,AI持續在不同領域上發揮作用。虛擬人已能代理人類完成特定任務,是新興科技從工具擴展至落地應用服務的關鍵產物。 透過觀察AI如何賦能Web3的發展,以及觀測各種國際創新應用案例,請參加此免費研討會,了解「虛擬人應用發展趨勢」和「從AI賦能Web3新興應用看發展趨勢」二個議題
Thumbnail
隨著ChatGPT問世以來,AI持續在不同領域上發揮作用。虛擬人已能代理人類完成特定任務,是新興科技從工具擴展至落地應用服務的關鍵產物。 透過觀察AI如何賦能Web3的發展,以及觀測各種國際創新應用案例,請參加此免費研討會,了解「虛擬人應用發展趨勢」和「從AI賦能Web3新興應用看發展趨勢」二個議題
Thumbnail
什麼是 Google Gemini? Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族,繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布,包括 Gemini Ultra、Pro 和 Nano,旨在超越 OpenAI 的 GPT-4
Thumbnail
什麼是 Google Gemini? Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族,繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布,包括 Gemini Ultra、Pro 和 Nano,旨在超越 OpenAI 的 GPT-4
Thumbnail
在數位化的世界中,用戶介面和信息圖表等視覺元素扮演著越來越重要的角色,而ScreenAI的開發為自然語言處理和計算機視覺的融合開啟了新的可能性。
Thumbnail
在數位化的世界中,用戶介面和信息圖表等視覺元素扮演著越來越重要的角色,而ScreenAI的開發為自然語言處理和計算機視覺的融合開啟了新的可能性。
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News