方格子 vocus

Google Gemini 2.5 Pro：最先進的AI模型排行再次洗牌

TN科技筆記(TechNotes)

發佈於科技領域筆記

2025/04/05 更新2025/03/28 發佈閱讀 2 分鐘

隨著人工智慧技術的快速演進，Google 日前正式推出其最新旗艦模型 Gemini 2.5 Pro，宣稱這是迄今為止最先進、最具智慧的AI模型。這款模型內建「思考」與推理能力，能逐步處理複雜任務，提供更精確且具上下文感知的回應。

Gemini 2.5: Our most intelligent AI model

Gemini 2.5 Pro 功能亮點

目前Gemini 2.5 Pro Experimental已透過Google AI Studio開放給開發者和企業用戶使用，同時 Gemini Advanced 訂閱者也能透過網頁客戶端和應用程式體驗其功能。Gemini 2.5 Pro 在多個領域展現出卓越表現，包括：

推理能力：不同於傳統預測模型，Gemini 2.5 Pro 在回應前能逐步推理問題，提供更具邏輯性的解答。
程式設計：它能從單行提示生成可執行的網頁應用程式、編輯程式碼，甚至創建完整的視訊遊戲。
多模態處理：支援文字、音訊、圖像和影片等多種數據格式，應用場景廣泛。

Gemini 2.5 Pro 的領先地位

Google 提供了多項基準測試數據，證明 Gemini 2.5 Pro 在多個領域上都具備領先優勢，尤其是在需要深度思考與技術創新的場景中，以下是其測試表現：

LMArena 排行榜（Hugging Face）
- 根據以人類偏好為基礎的 LMArena 排行榜，Gemini 2.5 Pro 目前位居第一，顯示其輸出品質深受用戶肯定。
數學與科學
- 在 GPQA（研究生級問題解答）中，單次嘗試得分為 84.0%，表現優異。在 AIME 2025（數學領域問題）中，單次嘗試得分高達 86.7%，展現其在高階數學推理上的能力。
人類最終考試（Humanity’s Last Exam）
- 未使用外部工具的情況下得分 18.8%，超越其他模型，顯示其在高難度推理任務中的潛力。
程式設計能力
- 在 SWE-Bench Verified 基準測試中，搭配自訂代理設置得分達 63.8%，證明其在軟體工程領域的強大實力。
Gemini 2.5: Our most intelligent AI model

Google Gemini 2.5 Pro 憑藉其內建推理能力、強大的程式設計功能和多模態處理優勢，無疑是 2025 年 AI 領域的一大亮點。無論是開發者還是企業用戶，這款模型都提供了前所未有的技術可能性。然而，隨著競爭對手不斷進化，Gemini 2.5 Pro 是否能長期保持領先，仍需時間驗證，我也會帶著各位讀者持續關注！

我是TN科技筆記，如果喜歡這篇文章，歡迎留言、點選愛心、轉發給我支持鼓勵～

也歡迎每個月請我喝杯咖啡，鼓勵我撰寫更多科技文章，一起跟著科技浪潮前進！！

TN科技筆記(TechNotes)的沙龍科技領域筆記

留言

TN科技筆記(TechNotes)的沙龍

71會員

234內容數

大家好，我是TN，喜歡分享科技領域相關資訊，希望各位不吝支持與交流！

TN科技筆記(TechNotes)的沙龍的其他內容

2025/04/23

TTS模型：NotebookLM、ElevenLabs、Sesame與Dia四大技術比拼

介紹TTS模型（文字轉語音）的運作原理與應用，比較Google NotebookLM Podcast、ElevenLabs Studio、Sesame CSM-1B與Nari Labs Dia的特色、優勢與限制。從對話逼真度到語音複製，幫助您選擇最適合的TTS解決方案。

2025/04/23

TTS模型：NotebookLM、ElevenLabs、Sesame與Dia四大技術比拼

2025/04/19

Gemma 3 QAT 量化技術解析：讓 AI 走進家用電腦

隨著 AI 的快速發展，大型語言模型的性能不斷提升，但顯卡等硬體需求往往讓一般用戶望而卻步。Google 於 2025 年 4 月 18 日發布的 Gemma 3 系列量化模型，透過 Quantization-Aware Training（QAT）技術，成功將頂尖 AI 性能帶入消費級硬體，如 N

2025/04/19

Gemma 3 QAT 量化技術解析：讓 AI 走進家用電腦

2025/04/16

提升效率的 AI 利器：Grok Workspaces 與 Studio 功能比較與最佳使用場景

xAI 的 Grok 3 於 2025 年 4 月陸續推出 Grok Workspaces 和 Grok Studio ，各自針對不同的使用需求，來幫助用戶提升工作效率與創意實現。本文將深入介紹這兩個功能的特色、差異，以及最適合的使用情境，幫助你選擇合適的工具

2025/04/16

提升效率的 AI 利器：Grok Workspaces 與 Studio 功能比較與最佳使用場景

#AI 的其他內容

Claude Cowork：我從零開始設計一個 5 人 Agent 幕僚團隊的思路

賴仕涵的思考王國

💖當「我的女朋友叫GEMINI」成為公開認同：台視【熱線追蹤】觀後感

小貝的多媒體學習日記．Beibei's diary

為什麼很多專業剪輯師不用剪映？剪映 vs Adobe Premiere Pro 差異

你可能也想看

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

創作不只是個人戰，在 vocus ，也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」，現在有了更強大的新夥伴加入！除了大家熟悉的「官方主題沙龍」，這次我們徵召了 8 位領域各異的「個人主題專家」，將再度嘗試創作的各種可能，和格友們激發出更多未知的火花。

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

【野格團開箱｜上篇】首波新成員登場！5 題靈魂拷問，直擊「個人主題專家」的創作後台🔥

vocus 最具指標性的創作者社群──「野格團」， 2026 年春季，這支充滿專業、熱情的團隊再次擴編，迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇，他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。

#創作#創作者推薦#靈感

2026/03/25

方格子 vocus 官方沙龍

【野格團開箱｜上篇】首波新成員登場！5 題靈魂拷問，直擊「個人主題專家」的創作後台🔥

#創作#創作者推薦#靈感

2026/03/25

Baozilla, Let's go!

20240726_TechNEws

OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」，由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布，該引擎能結合來自網路的即時資訊，讓使用者像與 ChatGPT 交談一樣搜尋。透過 SearchGPT，用戶能以自然語言提出問題（與使用 ChatGPT 交談方式相同

2024/07/26

Baozilla, Let's go!

20240726_TechNEws

2024/07/26

窩 World

NotebookLM：Google 結合 AI 最新推出的筆記本工具，讓你生成問題、快速摘要，以及建立專屬知識庫

隨著 AI 技術的進步，Google 推出了一款令人興奮的生產力工具—NotebookLM。這款結合 Gemini 1.5 Pro 模型的筆記本工具不僅能輕鬆生成問題、快速摘要文檔，還能幫助你建立專屬知識庫。今天，我將介紹 NotebookLM 是什麼、如何使用它，以及在三種不同情境中的應用方法。

#科技#學習#數位

2024/07/03

窩 World

NotebookLM：Google 結合 AI 最新推出的筆記本工具，讓你生成問題、快速摘要，以及建立專屬知識庫

#科技#學習#數位

2024/07/03

⏳熵妮的沙龍☆

AI 無法回答我全部的問題

AI -Gemini : 我鼓勵你探索自己的答案，並找到讓你感到充實和意義的東西。我的 AI -Gemini 無法回答我全部的問題... “我從哪裡來？” “現在發生的事情的品質如何？” AI -Gemini : 我是一個由 Google AI 創建的大型語言模型，在大量文字和程式碼...

2024/05/24

2024/05/24

Google AI 發表：LearnLM 融入既有教育產品，很有潛力對教育產生大幫助

Google最新發表了針對學習進行微調的Gemini新模型系列「LearnLM」，將學習科學原理融入模型及其支援的產品中，包括Google搜尋、Gems、YouTube和Google Classroom。這些新功能將對教育工作者和學習者產生深遠的影響。

#Google#教育#GPT-4o

2024/05/15

學習玩家｜啟動玩心學習

Google AI 發表：LearnLM 融入既有教育產品，很有潛力對教育產生大幫助

#Google#教育#GPT-4o

2024/05/15

樂子

Google Gemini 對比 ChatGPT：AI助手評測

這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現，並對比了它們在簡單問題、創作文本和回應短文等方面的效果。

#ChatGPT#AI#人工智慧

2024/04/30

樂子

Google Gemini 對比 ChatGPT：AI助手評測

這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現，並對比了它們在簡單問題、創作文本和回應短文等方面的效果。

#ChatGPT#AI#人工智慧

2024/04/30

大勢男寫手的沙龍

在香港如何使用 Google Gemini？

什麼是 Google Gemini？ Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族，繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布，包括 Gemini Ultra、Pro 和 Nano，旨在超越 OpenAI 的 GPT-4

#AI#科技

2024/04/19

大勢男寫手的沙龍

在香港如何使用 Google Gemini？

#AI#科技

2024/04/19

Everything ✨

全球最強 AI 模型 - Claude 3，ChatGPT 的最強競爭對手

Anthropic推出了新的Claude 3系列模型，號稱打敗OpenAI GPT-4與Google Gemini，成為地表最強的AI模型。文章介紹了Anthropic公司的核心理念、Claude 3模型家族與GPT-4 Gemini的比較。Claude 3模型在文字與圖像的理解能力都有大幅提升。

#GPT-4#模型#OpenAI

2024/03/06

Everything ✨

全球最強 AI 模型 - Claude 3，ChatGPT 的最強競爭對手

#GPT-4#模型#OpenAI

2024/03/06

Homeless Cosmopolitans' 實驗沙龍

【科學科技一科燙手報 Mk.2】：Google新發表的開源AI模型Gemma | 燙手度4天

大部分的人都知道Open AI的ChatGPT，部份的人知道Perplexity一類的生成式AI模型，還有一些人知道Google研發的生成式AI模型：Gemini (意思是拉丁文的雙生)。但幾小時前開放給開發者及研究者的開源AI模型Gemma（意思是拉丁文珍貴的石頭）大概沒什麼知道，

#Gemma#Google#AI

2024/02/25

Homeless Cosmopolitans' 實驗沙龍

【科學科技一科燙手報 Mk.2】：Google新發表的開源AI模型Gemma | 燙手度4天

#Gemma#Google#AI

2024/02/25

手哥科科

Google 發表新 AI 模型 Gemini 1.5，提供更大的「腦容量」和效率

今天 Google 發表了最新的 AI 模型 Gemini 1.5，不只提高模型訓練和服務效率，而且擁有更強大的理解力，每次能處理的 token 長度更是一口氣突破 100 萬大關，是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度)，可以處理更大量的資訊，也擁有更大

#Google#模型#GPT-4

2024/02/17