Google I/O 2025 懶人包：看 Google 如何塑造 AI 科技新未來

2025/05/22 更新2025/05/21 發佈閱讀 10 分鐘

一年一度的科技盛事 Google I/O 2025 盛大落幕！今年毫無疑問地， AI 再次成為全場的絕對焦點，Google 全面擁抱 AI 的決心展露無遺。本篇文章將為大家整理 Google I/O 2025 的重點懶人包，帶你一探究竟 Google 如何透過 AI 重塑未來科技，並解析這些技術如何影響我們的生活與開發工作！

Google I/O 2025

Google I/O 2025：AI 創新無所不在

今年的 Google I/O 大會，最核心的理念莫過於「Gemini 時代的理念 (Gemini Era Philosophy)」。Google 強調，他們正以前所未有的速度將最頂尖的 AI 模型與產品推向市場，目標是讓更多 AI 普及到世界上的每一個人。自上次 I/O 大會以來，Google 已宣布了十多個模型和研究突破，並發布了超過20項主要的 AI 產品和功能，展現了其強大的基礎設施與 TPU (Tensor Processing Unit) 的優勢。

Gemini AI 模型家族全面進化：更強、更快、更懂你

作為 Google AI 的核心，Gemini 模型家族在本次大會上迎來了升級：

Gemini 2.5 Pro：

Deep Think 實驗性推理模式：賦予模型更深層次的思考與推理能力，提升生產力與生活品質。
LMArena 排行榜制霸：在多項基準測試中達到頂尖水準，Elo 分數自第一代 Gemini Pro 以來提高了300多點，並在 WebDev Arena 編碼排行榜上名列前茅。
整合 LearnLM：與教育專家共同打造，使其成為學習領域的領先模型。
Native Audio Output：支援多達24種語言的母語音訊輸出，能以更富表現力的方式進行對話，捕捉語氣的細微變化，甚至無縫切換到耳語。
思維摘要 (Thought Summaries)：將模型的原始想法組織成清晰格式，提高透明度，方便除錯。
思維預算 (Thinking Budgets)：允許開發者控制成本、延遲與品質之間的平衡。
多模態能力展示：Tulsee Doshi 展示了如何使用 Gemini 2.5 Pro 將草圖轉換為 3D 網頁應用程式，展現其強大的圖像理解與程式碼生成能力。

Gemini 2.5 Flash：

效率與速度的極致追求更高效率與更低成本：因其速度和低成本而廣受開發者歡迎，新版 Flash 在推理、程式碼和長情境等關鍵基準測試上均有改進，效率提升22%。
LMArena 排行榜第二：表現僅次於 2.5 Pro。Native Audio Dialogue (即將推出)：Live API 將支援 2.5 Flash 預覽版的原生音訊對話，讓開發者能建立更自然的 Gemini 對話體驗。

Gemini Diffusion：

文本生成的革命將 Diffusion 技術的強大能力應用於文本編輯，包括數學和程式碼情境，實現極低延遲。生成速度比 Google 最快的模型 2.0 Flash-Lite 快五倍，同時匹配其編碼性能。

Google Search 智慧搜尋再進化：AI Mode 引領新浪潮

Google Search 正經歷一場由 AI 驅動的徹底重塑：

AI Mode 全面開放 (美國)：

作為 Search 的下一步重大革新，AI Mode 允許用戶提出更長、更複雜的查詢。本週起，Gemini 2.5 將引入 Search 。
個人化情境 (Personal Context)：在用戶允許下，Gemini 模型可利用跨 Google 應用程式（如 Gmail）的相關情境，提供更個人化的建議，例如根據近期餐廳預訂推薦戶外座位，或根據郵件中的機票飯店確認單推薦行程。此功能將於今年夏天在 AI Mode 中推出。

Search Live：

與搜尋引擎「視訊通話」：結合 Project Astra 的即時能力，用戶可使用手機相機，讓 Search「看見」你所見，並進行即時互動，解決居家維修、課業難題等。

AI 驅動的購物體驗：

視覺化購物：根據描述動態生成產品圖像瀏覽，並結合 Google Shopping Graph 超過500億個產品列表。虛擬試穿 (Virtual Try-on)：利用為時尚特訓的圖像生成模型，讓用戶虛擬試穿衣物。
代理結帳 (Agentic Checkout)：追蹤產品價格，設定目標價，並在用戶指示下透過 Google Pay 安全完成購買。

Android XR 延展實境：開啟沉浸式互動新紀元

Android XR 是 Gemini 時代打造的第一個 Android 平台，旨在支援從頭戴式裝置到智慧眼鏡等廣泛設備：

Project Moohan 頭戴式裝置：作為首款 Android XR 設備，提供無限螢幕探索應用，並有 Gemini 隨侍在側。預計今年稍晚發售。
智慧眼鏡平台：Google 將與 Samsung 的合作擴展至眼鏡領域，創建軟體和參考硬體平台。
眼鏡生態系拓展：Gentle Monster 和 Warby Parker 將成為首批與 Android XR 合作開發眼鏡的眼鏡品牌，Xreal 也是合作夥伴之一。
AI 助理的深度整合：眼鏡上的相機和麥克風賦予 Gemini 看見和聽見世界的能力，可進行即時語言翻譯（如現場展示的波斯語、印地語與英語互譯）、獲取資訊、甚至作為個人提詞器。

賦能開發者：全新工具與開放模型

Google 持續為開發者提供強大的 AI 工具與資源：

Firebase Studio：整合 Gemini 2.5 的 AI 工作區，支援從提示到發布的工作流程及 Figma 導入。
Firebase AI Logic：允許客戶端使用 Gemini API 和混合推理。
Jules 非同步程式碼代理：進入公開測試版，能處理複雜的程式碼任務，如在幾分鐘內更新舊版 Node.js。
開放模型百花齊放：Gemma 3n 專為行動裝置設計，可在2GB RAM 上運行的 AI 模型。MedGemma 用於醫療文本/圖像處理。
Colab AI-First 體驗：整合 Gemini 2.5 Flash，簡化任務導航和 UI 建構。

Project Astra：通用 AI 助理的未來藍圖

Project Astra 是一個探索通用 AI 助理能力的早期研究專案，其部分能力已開始導入產品：

Gemini Live 整合 Astra 能力：具備相機和螢幕共享功能，讓用戶可以談論所見所聞，已在 Android 和 iOS 上免費推出，支援超過45種語言。
進階能力：更自然的 Native Audio 語音輸出、改進的記憶能力、電腦控制能力（如線上搜尋用戶手冊、查找影片、搜尋郵件、撥打電話）。
輔助功能應用：與 Aira 合作，利用 Astra 技術協助盲人及低視能社群。
終極願景：將 Gemini 應用程式打造成最個人化、主動且強大的通用 AI 助理。

生成式媒體與內容安全

Google 在生成式媒體領域持續創新，並重視內容安全：

Music AI Sandbox & Lyria 2：Lyria 2 模型能生成高保真音樂和專業級音訊，已向企業、YouTube 創作者和音樂家開放。
Flow AI 電影製作工具：結合 Veo、Imagen 和 Gemini，讓創意人士能從圖像和文本提示創建完整的 AI 影片，並保持角色和場景一致性。
SynthID 浮水印技術擴展：將隱形浮水印嵌入 AI 生成的圖像、音訊、文本和影片中，迄今已有超過100億件內容被打上浮水印。新的 SynthID 檢測器能更容易識別內容是否包含浮水印。
Imagen 4 & Veo 3 導入 Gemini App：Imagen 4 帶來更豐富細節的圖像，Veo 3 則支援原生音訊生成（音效、背景音、對話）。

Google I/O 2025 從更全面的 Gemini 模型、徹底革新的搜尋體驗、身臨其境的 Android XR，到賦能開發者的強大工具，Google 正將大量的 AI 研究成果轉化為產品與服務。AI 不僅將改變我們與科技互動的方式，更將在科學探索、內容創作、日常生活的方方面面帶來深遠影響。今年的 Google I/O 無疑是 AI 發展史上的一個重要里程碑，讓我們拭目以待這些創新技術如何逐步走進我們的生活吧！

我是TN科技筆記，如果喜歡這篇文章，歡迎留言、點選愛心、轉發給我支持鼓勵～

也歡迎每個月請我喝杯咖啡，鼓勵我撰寫更多科技文章，一起跟著科技浪潮前進！！

TN科技筆記(TechNotes)的沙龍科技領域筆記

留言