許多開發者、行銷人員與內容創作者正積極探索如何將 Google 強大的 AI 模型 Gemini 應用在自己的工作中。好消息是,Google 提供了相當慷慨的免費額度,讓大家可以無痛體驗。然而,魔鬼藏在細節裡,免費額度並非毫無上限。
想要順暢地使用 Gemini API,你必須了解三個關鍵的限制指標:RPM (每分鐘請求數)、RPD (每日請求數),以及最重要的 TPM (每分鐘權杖數)。這篇文章將為你完整解析這些限制,幫助你選擇最適合的模型,避免在關鍵時刻碰壁。
搞懂三大限制:TPM、RPM 與 RPD
在我們深入各模型的具體額度之前,先來搞懂這三個縮寫代表什麼:
- RPM (Requests Per Minute):每分鐘請求數
這代表你在一分鐘內,可以向 Gemini API 發送多少次請求。例如,RPM 為 10,代表每分鐘最多可以呼叫 API 10 次。 - RPD (Requests Per Day):每日請求數
這是一天內總請求次數的上限。即使你沒有超過 RPM 的限制,只要當天的總請求量達到 RPD 上限,就必須等到隔天才能繼續使用。 - TPM (Tokens Per Minute):每分鐘權杖數
這是最常被忽略、卻也最關鍵的限制。「權杖 (Token)」是 AI 理解語言的最小單位,可以是一個單字、一個字元或一部分的字。TPM 限制了你在每分鐘內,所有請求加總起來的內容長度。即使請求次數(RPM)不多,但如果你的問題或文章很長,依然可能因為超過 TPM 而被限制。
簡單來說,RPM/RPD 管的是「你問了幾次」,而 TPM 管的是「你問的內容有多長」。三者之中只要有任何一項超標,API 就會暫時停止回應。
Gemini 免費模型限制全攻略
接下來,我們來看看 Google 針對不同需求的模型,設定了哪些具體的免費額度。
一、文字輸出模型 (Text Models)
這類模型主要用於生成、分析與總結文字內容,是用途最廣泛的類型。
- 模型:Gemini 2.5 Pro (Experimental)
- TPM:250,000
- RPM:5
- RPD:100
- 適合場景:推理能力最強的模型,適合處理需要深度思考的複雜問題、分析長篇報告或生成高品質程式碼。但因為請求次數限制最嚴格,比較適合低頻率、實驗性質的任務。
- 模型:Gemini 2.5 Flash
- TPM:250,000
- RPM:10
- RPD:250
- 適合場景:速度與效能的平衡者。它的反應速度很快,請求額度也適中,非常適合用於聊天機器人、即時內容摘要、文案生成等需要頻繁互動的應用。
- 模型:Gemini 2.5 Flash-Lite
- TPM:250,000
- RPM:15
- RPD:1,000
- 適合場景:免費方案中的「速度之王」。擁有最高的請求次數額度,專為大規模、高頻率的輕量級任務設計。如果你需要處理大量且單純的指令,這是你的最佳選擇。
二、多模態生成模型 (Multimodal Models)
這類模型除了處理文字外,還能生成圖片或聲音,功能更加強大。
- 模型:Gemini 2.0 Flash (圖片生成)
- TPM:200,000
- RPM:10
- RPD:100
- 適合場景:根據文字描述生成圖片。每日 100 張的額度對於社群貼文配圖、靈感發想等用途來說相當足夠。
- 模型:Gemini 2.5 Flash (TTS/文字轉語音)
- TPM:10,000
- RPM:3
- RPD:15
- 適合場景:將文字轉換為自然語音。目前此功能仍處於實驗階段,限制非常嚴格,僅適合小規模測試或短語音生成。
結論:如何聰明使用免費額度?
總結來說,Google Gemini 的免費方案為我們打開了通往強大 AI 世界的大門。要最大化利用這份資源,你需要:
- 評估你的需求:是需要深度分析還是快速互動?是純文字還是需要圖片生成?
- 選擇對的模型:根據你的需求選擇 RPM/RPD 和 TPM 額度最匹配的模型。
- 監控你的用量:在開發時留意 API 的回應,避免頻繁觸發
429
錯誤。
如果免費額度確實不敷使用,升級到 Google Cloud 的付費方案將能解鎖更高的效能與更寬鬆的限制。希望這篇文章能幫助你更順利地駕馭 Gemini,讓 AI 成為你創作與工作上的得力助手!