


Google 發表推理模型Gemini 2.5 Pro
Google於2025年3月26日正式推出新一代人工智慧模型Gemini 2.5 Pro Experimental,標誌著該公司在推理型AI技術上的重大突破。
此模型結合「顯著增強的基礎架構」與改進的後訓練技術,實現多項核心創新:
核心技術特性
原生推理能力:首度將「思考機制」內建於模型架構,透過逐步分析與邏輯推演處理複雜問題,相較傳統分類/預測型模型,能提供更精確的上下文感知回應。
多模態處理:支援文字、音訊、圖像、影片及程式碼等多種輸入形式,可解析大型程式碼庫與數據集,適用於科學研究與軟體開發場景。
超長上下文窗口:初始版本提供100萬token處理能力(約75萬字),即將擴充至200萬token,足以一次分析《魔戒》全書系等級的資料量。
性能表現
在LMArena基準測試中,以+39 ELO分數超越所有競爭對手,尤其在編碼與STEM(科學、技術、工程、數學)領域展現顯著優勢。
於SWE-bench Verified軟體開發測試中取得63.8%準確率,優於OpenAI o3-mini與DeepSeek R1,但略遜於Anthropic Claude 3.7 Sonnet(70.3%)。
在跨學科綜合測試Humanity’s Last Exam中,以18.8%得分領先多數旗艦模型。
應用與部署
即日起透過Google AI Studio開放開發者使用,Gemini Advanced訂閱用戶(月費20美元)可直接於Gemini應用程式切換此模型。
企業版將於近期登陸Vertex AI平台,定價方案尚未公布,但已知提供更高的API速率限制。
此版本被視為Google對抗OpenAI、Anthropic等競爭對手的關鍵技術升級,未來所有新模型都將內建推理能力,以支援更複雜的代理人(agent)應用場景。
實測顯示,Gemini 2.5 Pro已能依據單一文字提示生成完整電子遊戲程式碼,展現其端到端解決複雜任務的潛力。