Google Gemini 2.5 Deep Think ：看它如何用平行思考挑戰數學與程式碼極限

2025/08/03 更新2025/08/03 發佈閱讀 5 分鐘

Google 在 2025 年 8 月 1 日正式推出的 Gemini 2.5 Deep Think，讓 AI 能夠像人類專家一樣，花費「思考時間」來處理極度複雜的難題。對於所有希望利用 AI 解決真正棘手問題的人來說，這是一個不能錯過的發展，快跟TN科技筆記一起來看看吧！

Try Deep Think in the Gemini app

Google Gemini 2.5 Deep Think 懶人包

簡單來說，Google 這次並未發布一個全新的模型，而是在既有的 Gemini 2.5 Pro 基礎上，推出了一個名為「Deep Think」的增強思考模式。

目前，Gemini 2.5 Deep Think 主要提供給 Google AI Ultra 的訂閱用戶在 Gemini App 中使用，每天有固定的使用次數限制。同時，Google 也將開放 API 給一小群特定的數學家、學者與開發者進行測試。
Gemini 2.5 Deep Think 是一個專為解決複雜問題而設計的深度推理模式。當你啟用 Deep Think 後，等於是給予 Gemini 更多的「思考時間」與運算資源。
Gemini 2.5 Deep Think 特別擅長需要高度邏輯、創意規劃與逐步迭代的任務，例如解決國際數學奧林匹亞等級的難題、撰寫複雜的演算法，或是進行科學探索。

不再只求快！用「平行思考」模擬人類深度推理

Deep Think 的核心運作機制，是基於兩種關鍵技術的突破：「平行思考（parallel thinking）」與「延長推理時間（extending inference time）」。

想像一下，當一位專家面對難題時，他不會只沿著單一路徑思考。他會同時在腦中模擬好幾種可能的解法，評估各自的優劣，甚至將不同想法結合，最終才給出一個最完善的答案。Deep Think 正是模仿了這個過程。它會同時生成多個想法或解題路徑，並對它們進行即時的評估與修正，而不是像傳統模型一樣線性地吐出第一個想到的答案。

透過延長模型的「思考時間」，Google 讓 Gemini 有更充裕的機會去探索不同的假設，從而找到更具創造性與準確性的解決方案。為了讓模型能有效利用這段延長的時間，Google 還開發了新的強化學習技術，鼓勵模型探索更長的推理路徑，使其成為一個更直觀的問題解決者。

驚人效能！在數學與程式碼競賽中展現實力

Deep Think 的實力也反映在多項極具挑戰性的公開測試中。

數學能力：在 2025 年的國際數學奧林匹亞競賽基準測試中，日常版的 Deep Think 達到了銅牌等級的表現。而為了競賽使用的特殊版本，成功達到了金牌標準，展現了其巨大的潛力。在另一項 AIME 2025 數學競賽中，Deep Think 更是取得了 99.2% 的驚人成績。
程式碼生成：在衡量程式碼能力的 LiveCodeBench 測試中，Deep Think 拿下了 87.6% 的分數，超越了 OpenAI o3 (72%) 與 Grok 4 (79%) 等競爭對手，在處理複雜演算法開發與程式碼問題時，具備了頂尖水準。
綜合推理：在「Humanity's Last Exam」涵蓋科學與數學等多個領域的困難測試中，Deep Think 拿到 34.8% 的分數也遙遙領先其他模型。

TN科技筆記的觀點

過去 AI 競賽多半圍繞著通用能力的提升，但 Deep Think 顯示 Google 正將目光投向「專家級」的垂直領域。即使目前運算時間相當長，卻是一個強烈的訊號：AI 正在從「通才」走向「專才」。
未來的 AI 助理，可能不只會秒回你的問題，更能像個顧問一樣，陪你「慢慢想」，幫你把一個模糊的想法，打磨成一個具體可行的方案。AI 的價值，正在從「提供資訊」悄悄轉向「共創智慧」。