
Announcing Gemma 3n preview: powerful, efficient, mobile-first AI
繼先前 Gemma 3 與 Gemma 3 QAT 成功掀起話題後, 2025 年 5 月 20 日,Google 發布了 Gemma 家族的最新成員——Gemma 3n 的早期預覽版。這款模型不僅繼承了 Gemma 系列的強大基因,更將目光鎖定在我們日常生活中不可或缺的行動裝置上,致力於推動真正個人化、即時且私密的裝置端 AI 體驗。
Gemma 3n:為次世代裝置端 AI 而生
專為手機、平板、筆記型電腦等行動裝置量身打造
為了實現這一目標,Google 工程團隊與高通(Qualcomm Technologies)、聯發科(MediaTek)、三星等行動硬體巨頭緊密合作,共同研發了一套全新的尖端架構。這套架構特別針對高速、多模態 AI 進行了優化,未來也將成為次世代 Gemini Nano 的基礎。開發者們現在透過 Gemma 3n 預覽版所體驗到的創新技術,未來將廣泛應用於 Google 應用程式及 Android、Chrome 等主要平台的裝置端 AI 功能中。核心創新:Per-Layer Embeddings (PLE) 技術
Gemma 3n 最引人注目的技術亮點之一,便是 Google DeepMind 創新的「Per-Layer Embeddings (PLE)」技術。這項技術大幅降低了模型的 RAM 使用量。雖然 Gemma 3n 提供了 50 億(5B)和 80 億(8B)參數的原始版本,但 它們在運行時所需的記憶體卻能媲美 20 億和 40 億參數的模型,動態記憶體佔用分別僅需 2GB 和 3GB。這使得在記憶體有限的行動裝置上運行大型模型成為可能,或者能更流暢地從雲端串流模型。
Gemma 3n 的關鍵能力剖析
Gemma 3n 核心能力
- 強化裝置端效能與效率: 相較於 Gemma 3 4B 模型,Gemma 3n 在行動裝置上的回應速度提升約 1.5 倍,品質也顯著改善。這得益於 PLE、KVC 分享 (KVC sharing) 及先進的活化量化 (activation quantization) 等創新技術,有效降低了記憶體佔用。
- 多合一的靈活性: Gemma 3n 的 4B 參數模型巧妙地內嵌了一個最先進的 2B 參數子模型。這讓開發者可以根據需求動態調整效能與品質,而無需額外部署不同模型。Gemma 3n 更引入了「mix’n’match」功能,允許從 4B 模型中動態創建子模型,以最佳化適應特定使用情境及其對應的品質/延遲需求。
- 隱私優先與離線就緒: 本地端執行意味著 AI 功能可以在不依賴網路連線的情況下可靠運作,同時更能保障使用者隱私。
- 擴展的多模態理解(含音訊): Gemma 3n 能夠理解和處理音訊、文字、圖片,並顯著增強了影片理解能力。其音訊處理能力使其能執行高品質的自動語音辨識(ASR,即語音轉文字)和翻譯(語音轉譯文)。此外,模型支援跨模態的交錯輸入,能理解複雜的多模態互動。(音訊相關的公開實作即將推出)
- 強化的多語言能力: Gemma 3n 在多語言處理方面表現更佳,在 WMT24++ (ChrF) 等多語言基準測試中取得了 50.1% 的優異成績。
- 根據 Chatbot Arena Elo 分數的排名,Gemma 3n 在眾多知名的專有模型和開源模型中均名列前茅,顯示其強大的使用者偏好度。

Announcing Gemma 3n preview: powerful, efficient, mobile-first AI
負責任的 AI 開發
與所有 Gemma 模型一樣,Gemma 3n 也經過了嚴格的安全評估、資料治理,並根據 Google 的安全政策進行了微調對齊。
立即體驗 Gemma 3n 預覽版
- Google AI Studio 雲端探索: 無需任何設定,直接透過 Google AI Studio 試用 Gemma 3n 的文字輸入功能。
- Google AI Edge 裝置端開發: 若希望在本地整合 Gemma 3n,Google AI Edge 提供了相關工具和函式庫,目前已可開始使用文字和圖像的理解/生成功能。
Gemma 3n 的推出,是 Google 在普及尖端、高效 AI 技術道路上邁出的重要一步。令人迫不及待想看看,隨著這項技術逐步開放,將會創造出哪些令人驚豔的應用!
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~
也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!
>>>請我喝一杯咖啡