Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06,似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的程式能力、前端網頁開發表現,以及多模態應用的突破,成為最新的AI焦點。本文將介紹 Gemini 2.5 Pro 的最新功能以及應用場景。

Gemini 2.5 Pro Preview: even better coding performance
Gemini 2.5 Pro 的核心更新:程式能力的全面升級
Gemini 2.5 Pro 的更新主要聚焦於提升程式性能,特別是在前端網頁開發、UI 設計,以及複雜的代理工作流(agentic workflows):1. 領先業界的前端網頁開發能力
Gemini 2.5 Pro 在 WebDev Arena 排行榜上榮登第一,超越 Anthropic 的 Claude 3.7 Sonnet,獲得 147 Elo 分的領先優勢。這項排行榜衡量模型在構建美觀且功能完善的網頁應用程式方面的表現,顯示 Gemini 2.5 Pro 在視覺設計與功能實現上的卓越能力。

2. 強大的多模態能力:從影片到程式碼
Gemini 2.5 Pro 在影片理解方面表現出色,在 VideoMME 基準測試中得分 84.8%,位居業界領先地位。結合其程式能力,該模型可將影片內容轉化為互動應用程式或遊戲。例如,該模型能根據單一提示快速生成具有響應式設計的網頁應用程式,並自動處理 CSS 樣式屬性(如顏色、字體、邊距等),大幅簡化開發流程。Google 提供的「Video to Learning App」範例更展現了驚人的能力,Gemini 2.5 Pro 僅基於一段影片,就能生成一個完整的互動學習應用程式,包含精緻的 UI 與動態功能。
此外,Gemini 2.5 Pro 支援高達 100 萬 token 的上下文窗口,使其在處理大型資料集或長篇內容時表現尤為突出。
3. 更高效的功能開發與錯誤修正
相較於前一版本(03-25),新版 Gemini 2.5 Pro 在功能調用(function calling)方面減少了錯誤,並提高了觸發率。此外,該模型在 IDE 環境中能快速生成新功能,並確保其樣式與其他組件一致。
實際應用場景:從概念到成品的快速轉化
Gemini 2.5 Pro 的強大之處在於將創意概念快速轉化為功能完善且美觀的應用程式。以下舉例可嘗試的應用場景:
1. 互動式教育平台
Gemini 2.5 Pro 可將教育內容(如 YouTube 教學影片或文字課程)轉化為互動式網頁學習平台。例如,輸入「從這段教學影片創建網頁應用程式」的提示,實現概念的視覺化呈現,生成一個讓學生可互動解答問題、觀看動畫解釋並即時獲得反饋的應用程式,讓學習體驗更具吸引力。
2. 互動式故事或遊戲應用程式
Gemini 2.5 Pro 可將敘事提示或影片轉化為網頁互動故事或遊戲應用程式。例如,從一段奇幻小說片段生成一個網頁應用程式,讓用戶透過選擇推進冒險故事,配有動畫背景和 HTML5 音效。其多模態能力能適應影片或文字輸入,將內容轉化為可玩的網頁體驗。此功能吸引獨立開發者或內容創作者,將敘事遊戲化。
Gemini 2.5 Pro Preview 05-06可透過 Google AI Studio 免費使用,用戶無需額外操作即可升級至新版模型。無論是快速構建網頁應用程式、將影片內容轉化為互動工具,還是處理複雜的代理式程式任務,這款模型都展現了無限可能。隨著 Google I/O 2025 即將於5月20日至21日舉辦,期待可以看到更多相關應用程式出現。
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~
也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!
>>>請我喝一杯咖啡