Google 於 2025 年 6 月 17 日宣布 Gemini 2.5 系列模型的最新更新,涵蓋 Gemini 2.5 Pro、Flash 及全新推出的 Flash-Lite 模型。這些更新不僅提升了模型的穩定性與效能,還針對開發者需求改進了成本效益與靈活性。TN科技筆記將帶各位介紹 Gemini 2.5 系列模型本次更新的重點。

Gemini 2.5: Updates to our family of thinking models
Gemini 2.5 系列模型的核心特色
Gemini 2.5 系列皆被設計為「思考模型」(thinking models),能在回應前進行邏輯推理,大幅提升準確度與效能。以下是三大模型的主要特色:Gemini 2.5 Pro:專為複雜任務打造
Gemini 2.5 Pro 已正式發佈穩定版本(基於 06-05 預覽版),無需更改即可直接應用於生產環境。它在 WebDev Arena 與 Aider Polyglot 等測試中表現卓越(文章截稿前均為排行榜第 1 名),特別適合需要高智慧的編碼與代理任務(agentic tasks)。其支援 100 萬 token 的上下文窗口、多模態輸入(文字、音訊、圖像、影片),最特別的是提供可調整的「思考預算」(thinking budgets),讓開發者能靈活控制成本與效能。
Gemini 2.5 Flash:高吞吐量與低延遲的平衡
Gemini 2.5 Flash 同樣發佈穩定版本(基於 05-20 預覽版),針對高吞吐量任務(如摘要生成與翻譯)進行最佳化。Google 簡化其定價結構,移除思考與非思考價格區分,統一為每 100 萬輸入 token 0.3 美元、輸出 token 2.5 美元,無論輸入 token 數量皆適用單一價格。此模型以低延遲與強大的多模態推理能力,成為高頻任務的理想選擇。
Gemini 2.5 Flash-Lite:極致追求成本效益的選擇
全新推出的 Gemini 2.5 Flash-Lite(預覽版)是系列模型中最具成本效益的模型,專為高吞吐量、低延遲任務(如分類與翻譯)設計。相較於 2.5 Flash,其輸入成本降低至三分之一,文字輸出成本僅六分之一,且在編碼、數學與多模態基準測試中超越 Gemini 2.0 Flash-Lite。Flash-Lite 預設關閉思考功能,但開發者可透過 API 參數動態調整思考預算,兼顧速度與智能。目前已在 Google AI Studio 與 Vertex AI 開放試用。
跨模型的技術亮點
- 增強安全性:Gemini 2.5 系列強化對間接提示注入攻擊(indirect prompt injection attacks)的防護,成為 Google 迄今最安全的系列模型。
- 思考摘要(Thought Summaries):在 Gemini API 與 Vertex AI 中,模型的推理過程以結構化格式呈現,包含標題、關鍵細節與工具使用資訊,提升透明度與除錯效率。
- 多模態與長上下文:支援文字、音訊、圖像、影片等多模態輸入,並擁有 100 萬 token 的超長上下文窗口,適用於複雜場景。
- 各類型應用場景:Gemini 2.5 Pro 廣泛應用於頂尖開發者工具,如 Cursor、Replit 與 GitHub,助力打造高效編碼與代理應用。Flash 與 Flash-Lite 則適合大規模任務,如自動化分類、即時翻譯與內容摘要。開發者可透過 Google AI Studio 與 Vertex AI 快速建構應用進行測試。
Google Gemini 2.5 系列模型的更新,展現了在效能、成本與靈活性上的全面改進。無論是追求極致的 Pro、平衡效能與速度的 Flash,或成本導向的 Flash-Lite,均為開發者與企業提供了多元選擇。
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>請我喝一杯咖啡