在 2025 年 Google I/O 大會上,Google 推出了兩款基於 Gemma 3 架構的創新 AI 模型:MedGemma 與 SignGemma。這兩款模型分別針對醫療應用與手語翻譯,展現了人工智慧在專業領域與無障礙溝通的巨大潛力。本文將介紹這兩款模型的功能、應用場景與未來發展,讓您快速了解它們如何改進醫療效率與提升聾病群體的溝通便利性。
MedGemma:醫療 AI 的創新應用

什麼是 MedGemma?
MedGemma 是一套專為醫療應用設計的開源 AI 模型,基於 Gemma 3 架構,提供兩種版本:- MedGemma 4B:這是一款 40 億參數的多模態模型,能同時處理醫療影像(如 X 光、皮膚科影像、病理切片)與文字。它採用預訓練的 SigLIP 影像編碼器,針對去識別化的醫療數據進行優化,適用於醫療影像分類、報告生成與影像相關問題解答。其設計輕量化,可在單一 GPU 上運行,降低開發者的硬體門檻。
- MedGemma 27B:一款 270 億參數的純文字模型,專注於醫療文字的深度理解與臨床推理,適合患者訪談、臨床筆記摘要與決策支持等任務。在 MedQA 基準測試中,MedGemma 的表現與更大規模的模型(如 GPT-4o)相當。
應用場景
MedGemma 的核心目的是加速醫療應用的開發,幫助醫療專業人士更高效地處理複雜任務。其主要應用包括:
- 醫療影像分析:協助放射科醫師分析 X 光、病理切片等影像,提供診斷參考。
- 臨床文件生成:自動生成結構化的醫療筆記,提升文件效率。
- 智慧診斷支持:整合醫療數據,提供決策輔助,但 Google 強調其輸出需經專業醫師審核,不得直接用於臨床診斷。
SignGemma:打破手語溝通障礙

Google I/O '25 Developer Keynote - American Sign Language
什麼是 SignGemma?
SignGemma 是 Google 即將於 2025 年底推出的另一款開源 AI 模型,專注於將手語轉換為口語或文字,目前以美國手語(ASL)轉英語為主。這款模型主要為了聾啞與聽障社群打造無障礙溝通工具,幫助開發者創建即時翻譯應用程式,提升社會包容性。
- ASL 翻譯:SignGemma 專為 ASL 轉英語設計,未來計畫擴展至多語言手語支持。
- 輕量化設計:作為 Gemma 家族的一部分,SignGemma 強調高效運行,適合在資源受限的設備上使用。
- 社群協作:SignGemma 仍處於測試階段,預計 2025 年底前公開。Google 目前正積極徵求社群、開發者與研究者的反饋,以確保模型在正式發布前能滿足實際需求。
應用場景
SignGemma 的推出將為人士提供全新的溝通方式,例如:
- 即時翻譯應用:將手語動作轉為文字或語音,促進與非手語使用者的交流。
- 教育與醫療場景:在學校或醫療環境中,幫助與教師、醫師無縫溝通。
- 無障礙科技:整合至行動裝置或穿戴設備,實現隨時隨地的翻譯功能。
MedGemma 與 SignGemma的推出彰顯了 Google 在醫療與無障礙領域的 AI 創新。MedGemma 已在 Hugging Face 平台上線。相信隨著這些模型的持續改進,AI 將有機會在提升醫療效率與社會包容性方面扮演更重要的角色!
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~
也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!
>>>請我喝一杯咖啡




















