AI 模型的軍備競賽從未停歇,但這一次,Google 似乎不想只談論模型有多「大」、或有多「聰明」。在最新發布的 Gemini 3 中,我們看到了一個更清晰的戰略方向:讓 AI 從一個知識淵博的「對話者」,進化成一個能夠自主行動的「代理人」(Agent)。這次的更新不僅是性能上的例行升級,更是一次從底層思維到開發者生態的全面革新。
當我們還在適應大型語言模型帶來的資訊革命時,Google 已經將目光投向 AI 的自主性與執行能力。Gemini 3 的發布,以及全新的「Google Antigravity」開發平台,預告著我們與 AI 的互動方式將迎來根本性的轉變。
A new era of intelligence with Gemini 3
這次發布會的懶人包
- 性能王者歸來:Gemini 3 Pro 在多項關鍵 AI 基準測試中,顯著超越了前代 Gemini 2.5 Pro 及其他競爭對手,無論是複雜推理、多模態理解還是數學能力,都達到了新的頂尖水準。
- 「AI 代理人」成為核心:這次的重點不再只是聊天。Gemini 3 被設計為一個能自主規劃、執行多步驟複雜任務的「代理人」,例如幫你預訂服務或整理收件匣。
- 全新代理人開發平台:Google 推出了名為「Google Antigravity」的代理人開發平台,讓開發者能以任務為導向,與 AI 代理人協同工作,大幅改變軟體開發流程。
- 搜尋體驗的再進化:Gemini 3 在發布第一天就直接整合進 Google 搜尋的 AI 模式中,能生成客製化的互動式圖表與模擬工具,讓搜尋不再只是提供連結,而是直接給你答案與工具。
- 更強大的「氛圍編程」(Vibe Coding):開發者現在可以用更自然、更模糊的語言指令,讓 Gemini 3 直接生成功能完整、視覺豐富的互動式應用程式,實現從一個想法到產品的快速轉換。
A new era of intelligence with Gemini 3

主要亮點剖析
性能再創巔峰:Gemini 3 Pro 的驚人成績單
每一次模型更新,基準測試(Benchmark)的跑分都是外界檢視其能力最直接的方式。Gemini 3 Pro 這次交出的成績幾近完美。根據 Google 官方資料,它在多個權威性測試上都取得了領先地位:
- 通用對話能力:在被譽為「大型模型競技場」的 LMArena 排行榜上,Gemini 3 Pro 獲得了 1501 的 Elo 分數,這是一個突破性的成績。
- 博士級推理能力:在考驗模型深層推理能力的 Humanity’s Last Exam 和 GPQA Diamond 測試中,Gemini 3 Pro 分別取得了 37.5% 和 91.9% 的高分,展現了其處理複雜學術問題的潛力。
- 多模態理解:在跨越文字、圖片、影片的綜合理解力測試 MMMU-Pro 和 Video-MMMU 中,得分為 81% 和 87.6%,證明其能無縫整合並理解多種類型的資訊。
簡單來說,這些數字意味著 Gemini 3 在理解使用者意圖的細微差別、拆解複雜問題、以及處理混合資訊(例如分析圖表並寫出摘要)的能力上,都有了顯著的提升。它的回覆變得更精準、直接,減少了不必要的客套話,更像一個真正的思考夥伴。
不只是聊天:邁向「AI 代理人」的 Agentic-First 思維
如果說過去的 AI 像一個萬事通的圖書館員,那 Gemini 3 的目標就是成為一個能幹的私人助理。這次發布會的核心概念是「代理人能力」(Agentic Capabilities)。
這代表 AI 不再只是被動地回答你的問題,而是能主動為你執行任務。Google 強調,透過更深度的推理能力和更穩定的工具使用,Gemini 3 能夠處理橫跨多個步驟的複雜工作流程。例如:
- 生活助理:你可以要求它「幫我預訂一家評價不錯的本地清潔服務」,它能自主上網搜尋、比較、甚至完成預訂。
- 工作效率:它可以幫你「整理 Gmail 收件匣裡所有關於 Q3 專案的郵件,並生成一份摘要」,將繁瑣的資訊整理工作自動化。
為了證明其長遠規劃能力,Google 展示了 Gemini 3 在 Vending-Bench 2 測試中的表現。該測試模擬經營一台自動販賣機一整年的商業決策,Gemini 3 Pro 展現了持續且一致的決策能力,最終獲得了比其他模型更高的回報。這證明了它在執行長期、複雜任務時,不容易「偏離主題」。
為開發者而生:全新平台 Google Antigravity 與「Vibe Coding」
對開發者而言,這次的更新可能是最具顛覆性的。Google 推出了全新的代理人開發平台Google Antigravity。
這並非一個傳統的整合開發環境(IDE),而是一個讓開發者從「指令者」變成「協作者」的平台。在 Antigravity 中,AI 代理人可以直接存取編輯器、終端機和瀏覽器,自主地規劃和執行端到端的軟體開發任務,甚至能驗證自己寫的程式碼。開發者扮演著架構師的角色,而多個 AI 代理人則像是你的開發團隊,同時進行編碼、除錯和測試。
與此同時,Gemini 3 將「Vibe Coding」的能力推向了新高。開發者不再需要撰寫精確的程式碼,而是可以用一句高層次的想法,例如「幫我做一個復古風格的 3D 太空船射擊遊戲」,Gemini 3 就能夠自主完成多步驟的規劃和編碼,生成視覺效果豐富、互動性更強的應用程式。

搜尋的終極型態?與 Gemini 3 融合的 AI Mode
對數十億普通用戶來說,最有感的變化將發生在 Google 搜尋上。這是 Google 首次在模型發布當天,就將其整合到搜尋的核心產品中。
在美國地區,Google AI Pro 與 Ultra 訂閱者現在可以在 AI 模式下,體驗由 Gemini 3 驅動的全新搜尋介面:
- 動態生成 UI:當你搜尋複雜主題時(例如「RNA 聚合酶如何運作」),搜尋結果頁不再只是一排藍色連結,而是可能直接生成一個包含圖表、甚至是互動式模擬工具的客製化介面,讓你直接在頁面上操作變數、理解概念。
- 更深層的意圖理解:得益於 Gemini 3 的推理能力,搜尋引擎能更好地理解你問題背後的真實意圖,從而找到過去可能會錯過的、更具相關性的高品質網頁內容。

TN科技筆記的觀點
這次的重點顯然是「代理人」和「Google Antigravity」。Google 不再滿足於只做一個更聰明的聊天機器人,它正在構建一個以 AI 代理人為核心的開發者生態。這是一個從「工具」到「平台」的思維轉變。讓 AI 自主執行任務,並提供一個讓開發者能駕馭這種能力的平台,這才是 Google 真正想建立的護城河。
除此之外,將最前沿的模型在發布首日就整合進數十億人使用的搜尋引擎,傳達了兩個訊息:第一,Google 對 Gemini 3 的穩定性與安全性有高度自信;第二,Google 決心利用其最龐大的產品(搜尋)來加速 AI 技術的普及與迭代,直接在真實世界中驗證其價值。
巧合的是,就在幾天前,xAI 也發布了 Grok 4.1的小幅更新,其更新重點與 GPT-5.1 類似,在於「情感智慧」與「人格魅力」。 而 Google 的 Gemini 3 則將賭注壓在「代理人」的實用性與自主能力上。這顯示出市場的兩種不同演化路徑:一種是將 AI 打造成完美的「對話夥伴」,另一種則是將其塑造成可靠的「數位員工」。未來哪條路能勝出,值得密切關注。
支持TN科技筆記,與科技共同前行
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡
在此也感謝每個月持續請我喝杯咖啡的讀者以及新加入的讀者們,讓我更加有動力為各位帶來科技新知!
以下是我的 threads 也歡迎追蹤、回覆、轉發喔!
>>>>> TN科技筆記(TechNotes)



















