隨著人工智慧技術的快速演進,Google 日前正式推出其最新旗艦模型 Gemini 2.5 Pro,宣稱這是迄今為止最先進、最具智慧的AI模型。這款模型內建「思考」與推理能力,能逐步處理複雜任務,提供更精確且具上下文感知的回應。

Gemini 2.5: Our most intelligent AI model
Gemini 2.5 Pro 功能亮點
目前Gemini 2.5 Pro Experimental已透過Google AI Studio開放給開發者和企業用戶使用,同時 Gemini Advanced 訂閱者也能透過網頁客戶端和應用程式體驗其功能。Gemini 2.5 Pro 在多個領域展現出卓越表現,包括:
- 推理能力:不同於傳統預測模型,Gemini 2.5 Pro 在回應前能逐步推理問題,提供更具邏輯性的解答。
- 程式設計:它能從單行提示生成可執行的網頁應用程式、編輯程式碼,甚至創建完整的視訊遊戲。
- 多模態處理:支援文字、音訊、圖像和影片等多種數據格式,應用場景廣泛。
Gemini 2.5 Pro 的領先地位
Google 提供了多項基準測試數據,證明 Gemini 2.5 Pro 在多個領域上都具備領先優勢,尤其是在需要深度思考與技術創新的場景中,以下是其測試表現:
- LMArena 排行榜(Hugging Face)
- 根據以人類偏好為基礎的 LMArena 排行榜,Gemini 2.5 Pro 目前位居第一,顯示其輸出品質深受用戶肯定。
- 數學與科學
- 在 GPQA(研究生級問題解答) 中,單次嘗試得分為 84.0%,表現優異。 在 AIME 2025(數學領域問題) 中,單次嘗試得分高達 86.7%,展現其在高階數學推理上的能力。
- 人類最終考試(Humanity’s Last Exam)
- 未使用外部工具的情況下得分 18.8%,超越其他模型,顯示其在高難度推理任務中的潛力。
- 程式設計能力
- 在 SWE-Bench Verified 基準測試中,搭配自訂代理設置得分達 63.8%,證明其在軟體工程領域的強大實力。
Gemini 2.5: Our most intelligent AI model
Google Gemini 2.5 Pro 憑藉其內建推理能力、強大的程式設計功能和多模態處理優勢,無疑是 2025 年 AI 領域的一大亮點。無論是開發者還是企業用戶,這款模型都提供了前所未有的技術可能性。然而,隨著競爭對手不斷進化,Gemini 2.5 Pro 是否能長期保持領先,仍需時間驗證,我也會帶著各位讀者持續關注!
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~
也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!
>>>請我喝一杯咖啡