一年一度的科技盛事 Google I/O 2025 盛大落幕!今年毫無疑問地, AI 再次成為全場的絕對焦點,Google 全面擁抱 AI 的決心展露無遺。本篇文章將為大家整理 Google I/O 2025 的重點懶人包,帶你一探究竟 Google 如何透過 AI 重塑未來科技,並解析這些技術如何影響我們的生活與開發工作!

Google I/O 2025:AI 創新無所不在
今年的 Google I/O 大會,最核心的理念莫過於「Gemini 時代的理念 (Gemini Era Philosophy)」。Google 強調,他們正以前所未有的速度將最頂尖的 AI 模型與產品推向市場,目標是讓更多 AI 普及到世界上的每一個人。自上次 I/O 大會以來,Google 已宣布了十多個模型和研究突破,並發布了超過20項主要的 AI 產品和功能,展現了其強大的基礎設施與 TPU (Tensor Processing Unit) 的優勢。Gemini AI 模型家族全面進化:更強、更快、更懂你
作為 Google AI 的核心,Gemini 模型家族在本次大會上迎來了升級:
Gemini 2.5 Pro:
- Deep Think 實驗性推理模式:賦予模型更深層次的思考與推理能力,提升生產力與生活品質。
- LMArena 排行榜制霸:在多項基準測試中達到頂尖水準,Elo 分數自第一代 Gemini Pro 以來提高了300多點,並在 WebDev Arena 編碼排行榜上名列前茅。
- 整合 LearnLM:與教育專家共同打造,使其成為學習領域的領先模型。
- Native Audio Output:支援多達24種語言的母語音訊輸出,能以更富表現力的方式進行對話,捕捉語氣的細微變化,甚至無縫切換到耳語。
- 思維摘要 (Thought Summaries):將模型的原始想法組織成清晰格式,提高透明度,方便除錯。
- 思維預算 (Thinking Budgets):允許開發者控制成本、延遲與品質之間的平衡。
- 多模態能力展示:Tulsee Doshi 展示了如何使用 Gemini 2.5 Pro 將草圖轉換為 3D 網頁應用程式,展現其強大的圖像理解與程式碼生成能力。
Gemini 2.5 Flash:
- 效率與速度的極致追求更高效率與更低成本:因其速度和低成本而廣受開發者歡迎,新版 Flash 在推理、程式碼和長情境等關鍵基準測試上均有改進,效率提升22%。
- LMArena 排行榜第二:表現僅次於 2.5 Pro。Native Audio Dialogue (即將推出):Live API 將支援 2.5 Flash 預覽版的原生音訊對話,讓開發者能建立更自然的 Gemini 對話體驗。
Gemini Diffusion:
- 文本生成的革命將 Diffusion 技術的強大能力應用於文本編輯,包括數學和程式碼情境,實現極低延遲。生成速度比 Google 最快的模型 2.0 Flash-Lite 快五倍,同時匹配其編碼性能。
Google Search 智慧搜尋再進化:AI Mode 引領新浪潮
Google Search 正經歷一場由 AI 驅動的徹底重塑:
AI Mode 全面開放 (美國):
- 作為 Search 的下一步重大革新,AI Mode 允許用戶提出更長、更複雜的查詢。本週起,Gemini 2.5 將引入 Search 。
- 個人化情境 (Personal Context):在用戶允許下,Gemini 模型可利用跨 Google 應用程式(如 Gmail)的相關情境,提供更個人化的建議,例如根據近期餐廳預訂推薦戶外座位,或根據郵件中的機票飯店確認單推薦行程。此功能將於今年夏天在 AI Mode 中推出。
Search Live:
- 與搜尋引擎「視訊通話」:結合 Project Astra 的即時能力,用戶可使用手機相機,讓 Search「看見」你所見,並進行即時互動,解決居家維修、課業難題等。
AI 驅動的購物體驗:
- 視覺化購物:根據描述動態生成產品圖像瀏覽,並結合 Google Shopping Graph 超過500億個產品列表。虛擬試穿 (Virtual Try-on):利用為時尚特訓的圖像生成模型,讓用戶虛擬試穿衣物。
- 代理結帳 (Agentic Checkout):追蹤產品價格,設定目標價,並在用戶指示下透過 Google Pay 安全完成購買。
Android XR 延展實境:開啟沉浸式互動新紀元
Android XR 是 Gemini 時代打造的第一個 Android 平台,旨在支援從頭戴式裝置到智慧眼鏡等廣泛設備:
- Project Moohan 頭戴式裝置:作為首款 Android XR 設備,提供無限螢幕探索應用,並有 Gemini 隨侍在側。預計今年稍晚發售。
- 智慧眼鏡平台:Google 將與 Samsung 的合作擴展至眼鏡領域,創建軟體和參考硬體平台。
- 眼鏡生態系拓展:Gentle Monster 和 Warby Parker 將成為首批與 Android XR 合作開發眼鏡的眼鏡品牌,Xreal 也是合作夥伴之一。
- AI 助理的深度整合:眼鏡上的相機和麥克風賦予 Gemini 看見和聽見世界的能力,可進行即時語言翻譯(如現場展示的波斯語、印地語與英語互譯)、獲取資訊、甚至作為個人提詞器。
賦能開發者:全新工具與開放模型
Google 持續為開發者提供強大的 AI 工具與資源:
- Firebase Studio:整合 Gemini 2.5 的 AI 工作區,支援從提示到發布的工作流程及 Figma 導入。
- Firebase AI Logic:允許客戶端使用 Gemini API 和混合推理。
- Jules 非同步程式碼代理:進入公開測試版,能處理複雜的程式碼任務,如在幾分鐘內更新舊版 Node.js。
- 開放模型百花齊放:Gemma 3n 專為行動裝置設計,可在2GB RAM 上運行的 AI 模型。MedGemma 用於醫療文本/圖像處理。
- Colab AI-First 體驗:整合 Gemini 2.5 Flash,簡化任務導航和 UI 建構。
Project Astra:通用 AI 助理的未來藍圖
Project Astra 是一個探索通用 AI 助理能力的早期研究專案,其部分能力已開始導入產品:
- Gemini Live 整合 Astra 能力:具備相機和螢幕共享功能,讓用戶可以談論所見所聞,已在 Android 和 iOS 上免費推出,支援超過45種語言。
- 進階能力:更自然的 Native Audio 語音輸出、改進的記憶能力、電腦控制能力(如線上搜尋用戶手冊、查找影片、搜尋郵件、撥打電話)。
- 輔助功能應用:與 Aira 合作,利用 Astra 技術協助盲人及低視能社群。
- 終極願景:將 Gemini 應用程式打造成最個人化、主動且強大的通用 AI 助理。
生成式媒體與內容安全
Google 在生成式媒體領域持續創新,並重視內容安全:
- Music AI Sandbox & Lyria 2:Lyria 2 模型能生成高保真音樂和專業級音訊,已向企業、YouTube 創作者和音樂家開放。
- Flow AI 電影製作工具:結合 Veo、Imagen 和 Gemini,讓創意人士能從圖像和文本提示創建完整的 AI 影片,並保持角色和場景一致性。
- SynthID 浮水印技術擴展:將隱形浮水印嵌入 AI 生成的圖像、音訊、文本和影片中,迄今已有超過100億件內容被打上浮水印。新的 SynthID 檢測器能更容易識別內容是否包含浮水印。
- Imagen 4 & Veo 3 導入 Gemini App:Imagen 4 帶來更豐富細節的圖像,Veo 3 則支援原生音訊生成(音效、背景音、對話)。
Google I/O 2025 從更全面的 Gemini 模型、徹底革新的搜尋體驗、身臨其境的 Android XR,到賦能開發者的強大工具,Google 正將大量的 AI 研究成果轉化為產品與服務。AI 不僅將改變我們與科技互動的方式,更將在科學探索、內容創作、日常生活的方方面面帶來深遠影響。今年的 Google I/O 無疑是 AI 發展史上的一個重要里程碑,讓我們拭目以待這些創新技術如何逐步走進我們的生活吧!
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~
也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!
>>>請我喝一杯咖啡