Gemini Pro 1.0 和 Gemini Pro 1.5 都是強大的工具,但它們適用於不同的需求並提供不同的功能。以下是它們的主要區別:
模態性
- Gemini Pro 1.0 主要基於文字,對圖片和視頻的支持有限(1.0-pro-vision)。
- Gemini Pro 1.5 真正的多模態,可以無縫處理文字、圖片、視頻和音訊。
輸入/輸出
- Gemini Pro 1.0 的文字輸入限制為 32,760 個令牌。
- Gemini Pro 1.5 的輸入容量巨大,可達 1,000,000 個令牌。
- Gemini Pro 1.0 的視覺版本允許最多 16 張圖片或 1 個視頻剪輯(最多 2 分鐘)與文字一起。
- Gemini Pro 1.5 可以處理文字、圖片、視頻和音訊的複雜組合。
- Gemini Pro 1.0 的輸出格式主要是基於文字的。
- Gemini Pro 1.5 的輸出更靈活,支持文字、JSON 和潛在的其他格式。
功能
- Gemini Pro 1.0 專注於文字生成、翻譯和基本的圖片/視頻理解。
- Gemini Pro 1.5 不僅限於文字生成,還提供如下高級功能:
- 函數呼叫:整合外部系統進行超出模型知識範圍的操作。
- 系統指令:提供指導以獲得更好的性能和期望的響應風格。
- 結合谷歌搜尋的基礎:訪問實時資訊,以獲得更準確、更相關的結果(僅限文字)。
- 增強的安全控制:基於特定類別和概率閾值調整響應過濾。
成本
- Gemini Pro 1.5 的成本是 Gemini Pro 1.0 的 20 倍。
- Gemini Pro 1.0 的文字輸入/輸出成本為每千字符 $0.000125(輸入)和 $0.000375(輸出)。
- Gemini Pro 1.5 的文字輸入/輸出成本為每千字符 $0.0025(輸入)和 $0.0075(輸出)。
- 圖片輸入成本:Gemini Pro 1.0 為每張 $0.0025,Gemini Pro 1.5 為每張 $0.00265。
- 視頻輸入成本:Gemini Pro 1.0 為每秒 $0.002,Gemini Pro 1.5 為每秒 $0.00265。
- 音訊輸入:每秒 $0.00025。
何時選擇哪一個
- Gemini Pro 1.0 適用於以文字為中心的任務、基本的圖片/視頻分析和對成本敏感的應用。
- Gemini Pro 1.5 適用於需要高級功能、大規模輸入和靈活輸出格式的複雜、多模態項目。
總結,Gemini Pro 1.5 在功能和靈活性方面相較於 1.0 有顯著的進步。最佳選擇取決於您的具體需求和預算。我的經驗法則是:Gemini Pro 1.0 用於文字生成,而 Gemini Pro 1.5 用於資料分析。
立即在 Google Sheets 中體驗 Gemini Pro 1.5 的強大功能。
在 Google Workspace 市場中安裝 Gemini AI for Google Sheets 附加元件。