Google 在 2025 年 8 月 1 日正式推出的 Gemini 2.5 Deep Think,讓 AI 能夠像人類專家一樣,花費「思考時間」來處理極度複雜的難題。對於所有希望利用 AI 解決真正棘手問題的人來說,這是一個不能錯過的發展,快跟TN科技筆記一起來看看吧!

Try Deep Think in the Gemini app
Google Gemini 2.5 Deep Think 懶人包
簡單來說,Google 這次並未發布一個全新的模型,而是在既有的 Gemini 2.5 Pro 基礎上,推出了一個名為「Deep Think」的增強思考模式。- 目前,Gemini 2.5 Deep Think 主要提供給 Google AI Ultra 的訂閱用戶在 Gemini App 中使用,每天有固定的使用次數限制。 同時,Google 也將開放 API 給一小群特定的數學家、學者與開發者進行測試。
- Gemini 2.5 Deep Think 是一個專為解決複雜問題而設計的深度推理模式。當你啟用 Deep Think 後,等於是給予 Gemini 更多的「思考時間」與運算資源。
- Gemini 2.5 Deep Think 特別擅長需要高度邏輯、創意規劃與逐步迭代的任務,例如解決國際數學奧林匹亞等級的難題、撰寫複雜的演算法,或是進行科學探索。
不再只求快!用「平行思考」模擬人類深度推理
Deep Think 的核心運作機制,是基於兩種關鍵技術的突破:「平行思考(parallel thinking)」與「延長推理時間(extending inference time)」。
想像一下,當一位專家面對難題時,他不會只沿著單一路徑思考。他會同時在腦中模擬好幾種可能的解法,評估各自的優劣,甚至將不同想法結合,最終才給出一個最完善的答案。Deep Think 正是模仿了這個過程。 它會同時生成多個想法或解題路徑,並對它們進行即時的評估與修正,而不是像傳統模型一樣線性地吐出第一個想到的答案。
透過延長模型的「思考時間」,Google 讓 Gemini 有更充裕的機會去探索不同的假設,從而找到更具創造性與準確性的解決方案。 為了讓模型能有效利用這段延長的時間,Google 還開發了新的強化學習技術,鼓勵模型探索更長的推理路徑,使其成為一個更直觀的問題解決者。
驚人效能!在數學與程式碼競賽中展現實力
Deep Think 的實力也反映在多項極具挑戰性的公開測試中。
- 數學能力:在 2025 年的國際數學奧林匹亞競賽基準測試中,日常版的 Deep Think 達到了銅牌等級的表現。 而為了競賽使用的特殊版本,成功達到了金牌標準,展現了其巨大的潛力。 在另一項 AIME 2025 數學競賽中,Deep Think 更是取得了 99.2% 的驚人成績。
- 程式碼生成:在衡量程式碼能力的 LiveCodeBench 測試中,Deep Think 拿下了 87.6% 的分數,超越了 OpenAI o3 (72%) 與 Grok 4 (79%) 等競爭對手,在處理複雜演算法開發與程式碼問題時,具備了頂尖水準。
- 綜合推理:在「Humanity's Last Exam」涵蓋科學與數學等多個領域的困難測試中,Deep Think 拿到 34.8% 的分數也遙遙領先其他模型。
TN科技筆記的觀點
- 過去 AI 競賽多半圍繞著通用能力的提升,但 Deep Think 顯示 Google 正將目光投向「專家級」的垂直領域。即使目前運算時間相當長,卻是一個強烈的訊號:AI 正在從「通才」走向「專才」。
- 未來的 AI 助理,可能不只會秒回你的問題,更能像個顧問一樣,陪你「慢慢想」,幫你把一個模糊的想法,打磨成一個具體可行的方案。AI 的價值,正在從「提供資訊」悄悄轉向「共創智慧」。
支持TN科技筆記,與科技共同前行
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡
在此也感謝每個月持續請我喝杯咖啡的讀者們,讓我更加有動力為各位帶來科技新知!