Google Gemini 2.5 Deep Think :看它如何用平行思考挑戰數學與程式碼極限

更新於 發佈於 閱讀時間約 5 分鐘

Google 在 2025 年 8 月 1 日正式推出的 Gemini 2.5 Deep Think,讓 AI 能夠像人類專家一樣,花費「思考時間」來處理極度複雜的難題。對於所有希望利用 AI 解決真正棘手問題的人來說,這是一個不能錯過的發展,快跟TN科技筆記一起來看看吧!

raw-image

Try Deep Think in the Gemini app

Google Gemini 2.5 Deep Think 懶人包

簡單來說,Google 這次並未發布一個全新的模型,而是在既有的 Gemini 2.5 Pro 基礎上,推出了一個名為「Deep Think」的增強思考模式。

  • 目前,Gemini 2.5 Deep Think 主要提供給 Google AI Ultra 的訂閱用戶在 Gemini App 中使用,每天有固定的使用次數限制。 同時,Google 也將開放 API 給一小群特定的數學家、學者與開發者進行測試。
  • Gemini 2.5 Deep Think 是一個專為解決複雜問題而設計的深度推理模式。當你啟用 Deep Think 後,等於是給予 Gemini 更多的「思考時間」與運算資源。
  • Gemini 2.5 Deep Think 特別擅長需要高度邏輯、創意規劃與逐步迭代的任務,例如解決國際數學奧林匹亞等級的難題、撰寫複雜的演算法,或是進行科學探索。

不再只求快!用「平行思考」模擬人類深度推理

Deep Think 的核心運作機制,是基於兩種關鍵技術的突破:「平行思考(parallel thinking)」與「延長推理時間(extending inference time)」。

想像一下,當一位專家面對難題時,他不會只沿著單一路徑思考。他會同時在腦中模擬好幾種可能的解法,評估各自的優劣,甚至將不同想法結合,最終才給出一個最完善的答案。Deep Think 正是模仿了這個過程。 它會同時生成多個想法或解題路徑,並對它們進行即時的評估與修正,而不是像傳統模型一樣線性地吐出第一個想到的答案。

透過延長模型的「思考時間」,Google 讓 Gemini 有更充裕的機會去探索不同的假設,從而找到更具創造性與準確性的解決方案。 為了讓模型能有效利用這段延長的時間,Google 還開發了新的強化學習技術,鼓勵模型探索更長的推理路徑,使其成為一個更直觀的問題解決者。

驚人效能!在數學與程式碼競賽中展現實力

Deep Think 的實力也反映在多項極具挑戰性的公開測試中。

  • 數學能力:在 2025 年的國際數學奧林匹亞競賽基準測試中,日常版的 Deep Think 達到了銅牌等級的表現。 而為了競賽使用的特殊版本,成功達到了金牌標準,展現了其巨大的潛力。 在另一項 AIME 2025 數學競賽中,Deep Think 更是取得了 99.2% 的驚人成績。
  • 程式碼生成:在衡量程式碼能力的 LiveCodeBench 測試中,Deep Think 拿下了 87.6% 的分數,超越了 OpenAI o3 (72%) 與 Grok 4 (79%) 等競爭對手,在處理複雜演算法開發與程式碼問題時,具備了頂尖水準。
  • 綜合推理:在「Humanity's Last Exam」涵蓋科學與數學等多個領域的困難測試中,Deep Think 拿到 34.8% 的分數也遙遙領先其他模型。

TN科技筆記的觀點

  • 過去 AI 競賽多半圍繞著通用能力的提升,但 Deep Think 顯示 Google 正將目光投向「專家級」的垂直領域。即使目前運算時間相當長,卻是一個強烈的訊號:AI 正在從「通才」走向「專才」。
  • 未來的 AI 助理,可能不只會秒回你的問題,更能像個顧問一樣,陪你「慢慢想」,幫你把一個模糊的想法,打磨成一個具體可行的方案。AI 的價值,正在從「提供資訊」悄悄轉向「共創智慧」。

支持TN科技筆記,與科技共同前行

我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者們,讓我更加有動力為各位帶來科技新知!

留言
avatar-img
留言分享你的想法!
avatar-img
TN科技筆記(TechNotes)的沙龍
35會員
138內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/07/31
2025 年 7 月29日、30日,Google 和 OpenAI 相繼推出了兩項重量級功能:Google 的 NotebookLM「影片導覽」和 OpenAI 的 ChatGPT「學習模式」。這些工具不僅讓複雜知識變得更易懂,還能根據你的需求量身打造學習體驗,快跟TN科技筆記一起來看看吧!
Thumbnail
2025/07/31
2025 年 7 月29日、30日,Google 和 OpenAI 相繼推出了兩項重量級功能:Google 的 NotebookLM「影片導覽」和 OpenAI 的 ChatGPT「學習模式」。這些工具不僅讓複雜知識變得更易懂,還能根據你的需求量身打造學習體驗,快跟TN科技筆記一起來看看吧!
Thumbnail
2025/07/29
在數位時代,瀏覽器就像我們的第二個大腦,開啟分頁、搜尋、閱讀、重複。這個模式固然有效,但在資訊爆炸的今天,它也讓我們淹沒在龐大的數據中。微軟於2025年7月28日在 Edge 瀏覽器中推出升級版的 Copilot 模式,讓TN科技筆記帶各位一探究竟!
Thumbnail
2025/07/29
在數位時代,瀏覽器就像我們的第二個大腦,開啟分頁、搜尋、閱讀、重複。這個模式固然有效,但在資訊爆炸的今天,它也讓我們淹沒在龐大的數據中。微軟於2025年7月28日在 Edge 瀏覽器中推出升級版的 Copilot 模式,讓TN科技筆記帶各位一探究竟!
Thumbnail
2025/07/24
阿里巴巴的 Qwen3-235B 系列,以及月之暗面的 Kimi K2。它們以其「開源」姿態,將頂尖 AI 技術推向更廣闊的開發者與研究社群。TN科技筆記帶各位來深入了解這兩款模型,幫助你掌握 AI 領域的最新趨勢。
Thumbnail
2025/07/24
阿里巴巴的 Qwen3-235B 系列,以及月之暗面的 Kimi K2。它們以其「開源」姿態,將頂尖 AI 技術推向更廣闊的開發者與研究社群。TN科技筆記帶各位來深入了解這兩款模型,幫助你掌握 AI 領域的最新趨勢。
Thumbnail
看更多
你可能也想看
Thumbnail
Google Meet 即將推出全新 AI 驅動的 "Take notes for me" 功能,自動記錄會議筆記。 適用於Gemini Enterprise、Education Premium 或 AI Meetings & Messaging 加值服務的 Google Workspace 用戶。
Thumbnail
Google Meet 即將推出全新 AI 驅動的 "Take notes for me" 功能,自動記錄會議筆記。 適用於Gemini Enterprise、Education Premium 或 AI Meetings & Messaging 加值服務的 Google Workspace 用戶。
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
隨著 AI 技術的進步,Google 推出了一款令人興奮的生產力工具—NotebookLM。這款結合 Gemini 1.5 Pro 模型的筆記本工具不僅能輕鬆生成問題、快速摘要文檔,還能幫助你建立專屬知識庫。今天,我將介紹 NotebookLM 是什麼、如何使用它,以及在三種不同情境中的應用方法。
Thumbnail
隨著 AI 技術的進步,Google 推出了一款令人興奮的生產力工具—NotebookLM。這款結合 Gemini 1.5 Pro 模型的筆記本工具不僅能輕鬆生成問題、快速摘要文檔,還能幫助你建立專屬知識庫。今天,我將介紹 NotebookLM 是什麼、如何使用它,以及在三種不同情境中的應用方法。
Thumbnail
AI -Gemini : 我鼓勵你探索自己的答案,並找到讓你感到充實和意義的東西。 我的 AI -Gemini 無法回答我全部的問題... “我從哪裡來?” “現在發生的事情的品質如何?” AI -Gemini : 我是一個由 Google AI 創建的大型語言模型,在大量文字和程式碼...
Thumbnail
AI -Gemini : 我鼓勵你探索自己的答案,並找到讓你感到充實和意義的東西。 我的 AI -Gemini 無法回答我全部的問題... “我從哪裡來?” “現在發生的事情的品質如何?” AI -Gemini : 我是一個由 Google AI 創建的大型語言模型,在大量文字和程式碼...
Thumbnail
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Thumbnail
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Thumbnail
什麼是 Google Gemini? Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族,繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布,包括 Gemini Ultra、Pro 和 Nano,旨在超越 OpenAI 的 GPT-4
Thumbnail
什麼是 Google Gemini? Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族,繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布,包括 Gemini Ultra、Pro 和 Nano,旨在超越 OpenAI 的 GPT-4
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News