Hi 我是 VK~
相信大家在上週看到了很多關於今年 Google I/O 的新進展與討論,而身為隔了一週才寫這個主題的人,在想要如何提供大家一些不同視角和觀察,可以從中有些收穫。
這期的內容除了會提到今年 I/O 的重要更新之外,也會介紹在創作者行程中看見的 Andriod XR 頭戴式裝置、智慧眼鏡實際體驗的心得。這次也有機會和 NotebookLM 內部團隊的聊聊,也會談到他們如何看待這項產品、如何設計等。
這期還有個特別的地方,在參與 I/O 前後各有段小空檔,感謝朋友們的帶路,有機會在舊金山的 Mission Bay,還有陡峭的 Hills 等地晃晃,感受另種科技和生活間的融合。(私心覺得這是上半年寫得很滿意的文章)
接下來會提到的內容有:
- Google I/O 觀察:King is Back、Gemini in everywhere
- Google I/O 沒講完的事:Andriod XR 頭戴式裝置和智慧眼鏡🔒
- NotebookLM 內部如何看待這款產品?還會繼續存活嗎?🔒
- 舊金山遊記:新舊城鎮的碰撞、Windsurf、Waymo🔒
喜歡這期的內容,歡迎分享給朋友一起訂閱《VK科技閱讀時間》,祝你今天一切順利~
Google I/O 觀察:King is Back、Gemini in everywhere
今年 Google I/O 非常精彩,無論是現場或是社群反應都能看到蠻多正面評價,這裡還是精簡扼要介紹一下重點,因為我們等等後面要來談 Andriod XR 等主題,如果想要看更多今年 Google I/O 更詳細的分析,推薦子軒、曼報、硅谷 101 等的討論。
2024 年在 Google I/O 前一天,OpenAI 搶先發布了 GPT-4o 模型,Google 的風頭再次被搶走。到了 2025 年的 Google I/O 終於不再被 OpenAI 搶走風采,而是讓人看到「King is Back」的野心,也讓外界看到這家科技巨頭的反擊。
Google 執行長 Sundar Pichai 自信地表示,他們發布新技術和產品的速度比以往任何時候都快,並聚焦在三大重點:智慧(intelligence)、代理(agent)和個人化(personlization)。
今年最大的亮點無疑是端出:更強大的模型 Gemini 2.5 系列模型的全面升級,深度整合旗下的產品,從 Gmail、Google Calendar 到 YouTube 等,最終提供更加個人化、情境化的體驗,讓用戶感受到 Gemini 無所不在。
之中有許多讓人期待的應用,Google 推出 Veo 3 影片生成模型,這是全球首個支援原生音頻生成的影片模型。不僅能產生高品質的影片,還能同步生成背景音效、環境聲音甚至角色對話。配合 Veo3,Google 還推出專業級的 Flow AI 電影製作工具,提供攝影機控制、場景編輯、素材管理等功能,讓創作者能夠輕鬆製作出電影級的影片內容。I/O 前一天,Google 還找來了在隔日會 DEMO 的影片創作者來分享背後製作的心路歷程。
除此之外,面對 AI 對傳統搜尋模式的衝擊,Google 選擇了「革自己的命」的策略,推出 AI Mode 搜尋體驗,能夠進行深度對話、持續提問的 AI 助手式體驗。另外,Google 也推出了多項令人期待的功能「AI 購物體驗」,結合虛擬試穿技術和價格追蹤,讓線上購物更加便捷和個人化;「Google Beam」前身為 Project Starline 的 3D 視訊平台,提供近乎面對面的遠端會議體驗。

Google I/O 沒講完的事:Andriod XR 頭戴式裝置和智慧眼鏡
Google 重新挑戰智慧眼鏡的領域,在今年會中他們不僅實際展示 Android XR 智慧眼鏡的應用場景,也宣布將攜手兩家眼鏡時尚潮牌 Gentle Monster、Warby Parker 來打造智慧眼鏡。
Android XR 智慧眼鏡整合 Gemini AI,可以透過語音指令,即時回答問題、提供建議。同時也具備視覺理解能力,可辨識周遭物體並提供相關資訊。它也能記住使用者曾經看過的物品位置,例如協助尋找遺失的飯店房卡等。
這次也在 I/O 的前一天實際體驗到智慧眼鏡,乍看之下和一般黑框造型的眼鏡沒有太大差異,但戴起眼鏡後,你可以使用習慣的語言和 Gemini AI 對話,體驗過程中我切換英文、中文它都能夠辨識並回答。
要請它辨識眼前物品,或是 Pocket 3 中正在拍攝的人,它都能清楚辨識出來,並且提供更多訊息和脈絡。小小缺點:它話實在有點多,在中文回答上多數情況下都是中國語境。
多語言這點也可以用在支援即時翻譯,同時智慧眼鏡支援拍照、聽音樂、講電話、語音控制傳訊息等功能,相關的訊息都會顯示在眼鏡中右邊的鏡片中。
在實際體驗中,聽音樂的功能遇到了一些問題,可以找到特定音樂但不能播放。後來解決這問題後,音樂的聲音比想像中大聲一點。雖然 Goolger 提到必須在臉貼臉的情況下才會聽到用戶智慧眼鏡中的音樂,但因為展示的空間相對安靜,在兩公尺的距離下是可以聽到音樂聲的。(不確定是眼鏡太重,還是我不習慣戴眼鏡,在體驗過程中眼鏡會一直滑下來)
看到這,你可能會覺得這和我們之前介紹 Meta 智慧眼鏡的功能非常相似,比如說 AI 語音助理、AI 即時翻譯等。這也是一剛開始我體驗前半部分的想法,之中 Meta 可以還可以連接社群直接把拍好的照片或影片上傳在社群中。
那 Google 的智慧眼鏡還可以做些什麼?這就需要講到讓我整個體驗最驚豔的地方:智慧眼鏡結合 Google Maps,提供擴增實境導航。
它會在鏡片內提供 3D 地圖與導航指引,讓使用者在行走時獲得即時路線資訊。聽起來有點不好想像,實際戴上的感覺是當你平視的時候,它會顯示在前方 200 公尺要轉彎,類似開導航時旁邊會顯示的資訊;當你低頭的時候,會在眼鏡中看到 3D 地圖,下面有一條指引線是用戶可以沿著走的。(非常適合路癡的我,用完之後我最喜歡這功能)
Google Maps 不僅深度整合進 Google 智慧眼鏡,甚至也出現在 Google 頭盔設備中。如果說智慧眼鏡的用途是幫助用戶導航,那麼 Google 頭盔設備則讓人瞬間移動到特定國家、特定街道等。
比如說,身為 F1 粉絲,戴上頭盔後我就跟 Gemini 說「帶我去新加坡賽道」,它真的帶我去了,但想要進入 Turn 1,可惜一直無法進入。不過同行的其他人,試著去了不同國家、不同城市,都可以快速地切換,並沉浸在其中。
- 當年失敗的原因:不懂消費電子供應鏈
在 DeepMind CEO Demis Hassabis 和 Google 共同創辦人 Sergey Brin 的對談中,Brin 坦承當年 Google Glass 的錯誤:「我真的不懂消費電子供應鏈,以及建造它並以合理價格點銷售有多困難。」當年 1500 美元的定價,加上過於前衛的外觀設計,讓 Google Glass 成為科技史上的經典失敗案例。
但這次的智慧眼鏡不同了。
Brin 提到關鍵差異:「現在在 AI 世界中,這些眼鏡能做的事情來幫助你,而不會持續分散你的注意力,那種能力要高得多。」