Google I/O 2025 的 MedGemma 與 SignGemma:專為醫療與手語翻譯的 AI

更新 發佈閱讀 4 分鐘

在 2025 年 Google I/O 大會上,Google 推出了兩款基於 Gemma 3 架構的創新 AI 模型:MedGemma 與 SignGemma。這兩款模型分別針對醫療應用與手語翻譯,展現了人工智慧在專業領域與無障礙溝通的巨大潛力。本文將介紹這兩款模型的功能、應用場景與未來發展,讓您快速了解它們如何改進醫療效率與提升聾病群體的溝通便利性。


MedGemma:醫療 AI 的創新應用

raw-image

MedGemma

什麼是 MedGemma?

MedGemma 是一套專為醫療應用設計的開源 AI 模型,基於 Gemma 3 架構,提供兩種版本:

  • MedGemma 4B:這是一款 40 億參數的多模態模型,能同時處理醫療影像(如 X 光、皮膚科影像、病理切片)與文字。它採用預訓練的 SigLIP 影像編碼器,針對去識別化的醫療數據進行優化,適用於醫療影像分類、報告生成與影像相關問題解答。其設計輕量化,可在單一 GPU 上運行,降低開發者的硬體門檻。
  • MedGemma 27B:一款 270 億參數的純文字模型,專注於醫療文字的深度理解與臨床推理,適合患者訪談、臨床筆記摘要與決策支持等任務。在 MedQA 基準測試中,MedGemma 的表現與更大規模的模型(如 GPT-4o)相當。

應用場景

MedGemma 的核心目的是加速醫療應用的開發,幫助醫療專業人士更高效地處理複雜任務。其主要應用包括:

  • 醫療影像分析:協助放射科醫師分析 X 光、病理切片等影像,提供診斷參考。
  • 臨床文件生成:自動生成結構化的醫療筆記,提升文件效率。
  • 智慧診斷支持:整合醫療數據,提供決策輔助,但 Google 強調其輸出需經專業醫師審核,不得直接用於臨床診斷。

SignGemma:打破手語溝通障礙

raw-image

Google I/O '25 Developer Keynote - American Sign Language

什麼是 SignGemma?

SignGemma 是 Google 即將於 2025 年底推出的另一款開源 AI 模型,專注於將手語轉換為口語或文字,目前以美國手語(ASL)轉英語為主。這款模型主要為了聾啞與聽障社群打造無障礙溝通工具,幫助開發者創建即時翻譯應用程式,提升社會包容性。

  • ASL 翻譯:SignGemma 專為 ASL 轉英語設計,未來計畫擴展至多語言手語支持。
  • 輕量化設計:作為 Gemma 家族的一部分,SignGemma 強調高效運行,適合在資源受限的設備上使用。
  • 社群協作:SignGemma 仍處於測試階段,預計 2025 年底前公開。Google 目前正積極徵求社群、開發者與研究者的反饋,以確保模型在正式發布前能滿足實際需求。

應用場景

SignGemma 的推出將為​人士提供全新的溝通方式,例如:

  • 即時翻譯應用:將手語動作轉為文字或語音,促進與非手語使用者的交流。
  • 教育與醫療場景:在學校或醫療環境中,幫助與教師、醫師無縫溝通。
  • 無障礙科技:整合至行動裝置或穿戴設備,實現隨時隨地的翻譯功能。

MedGemma 與 SignGemma的推出彰顯了 Google 在醫療與無障礙領域的 AI 創新。MedGemma 已在 Hugging Face 平台上線。相信隨著這些模型的持續改進,AI 將有機會在提升醫療效率與社會包容性方面扮演更重要的角色!

我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~

也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!

>>>請我喝一杯咖啡

留言
avatar-img
留言分享你的想法!
avatar-img
TN科技筆記(TechNotes)的沙龍
58會員
188內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/05/24
2025 年 5 月 20 日,Google 正式發布了 Gemma 家族的最新成員——Gemma 3n 的早期預覽版。這款模型不僅繼承了 Gemma 系列的強大基因,更將目光鎖定在我們日常生活中不可或缺的行動裝置上,致力於推動真正個人化、即時且私密的裝置端 AI 體驗。
Thumbnail
2025/05/24
2025 年 5 月 20 日,Google 正式發布了 Gemma 家族的最新成員——Gemma 3n 的早期預覽版。這款模型不僅繼承了 Gemma 系列的強大基因,更將目光鎖定在我們日常生活中不可或缺的行動裝置上,致力於推動真正個人化、即時且私密的裝置端 AI 體驗。
Thumbnail
2025/05/22
AI 領域的巨頭 Anthropic 正式推出了其下一代 Claude 模型:Claude Opus 4 與 Claude Sonnet 4。 這不僅僅是一次升級,而是對 AI 在程式碼撰寫、進階推理能力以及 AI 代理(AI agents)應用方面再創高峰。
Thumbnail
2025/05/22
AI 領域的巨頭 Anthropic 正式推出了其下一代 Claude 模型:Claude Opus 4 與 Claude Sonnet 4。 這不僅僅是一次升級,而是對 AI 在程式碼撰寫、進階推理能力以及 AI 代理(AI agents)應用方面再創高峰。
Thumbnail
2025/05/21
一年一度的科技盛事 Google I/O 2025 盛大落幕!今年毫無疑問地, AI 再次成為全場的絕對焦點,Google 全面擁抱 AI 的決心展露無遺。本篇文章將為大家整理 Google I/O 2025 的重點懶人包,帶你一探究竟 Google 如何透過 AI 重塑未來科技
Thumbnail
2025/05/21
一年一度的科技盛事 Google I/O 2025 盛大落幕!今年毫無疑問地, AI 再次成為全場的絕對焦點,Google 全面擁抱 AI 的決心展露無遺。本篇文章將為大家整理 Google I/O 2025 的重點懶人包,帶你一探究竟 Google 如何透過 AI 重塑未來科技
Thumbnail
看更多
你可能也想看
Thumbnail
Google Meet 即將推出全新 AI 驅動的 "Take notes for me" 功能,自動記錄會議筆記。 適用於Gemini Enterprise、Education Premium 或 AI Meetings & Messaging 加值服務的 Google Workspace 用戶。
Thumbnail
Google Meet 即將推出全新 AI 驅動的 "Take notes for me" 功能,自動記錄會議筆記。 適用於Gemini Enterprise、Education Premium 或 AI Meetings & Messaging 加值服務的 Google Workspace 用戶。
Thumbnail
上週精選✦這篇文章是一份豐富的資訊,涵蓋了很多人工智慧相關的項目和新聞。包括了Figma Config 大會、Google 開源的Gemma 2、Claude 的更新等。此外還包含了各種產品推薦和重點研究。文章豐富而全面,充滿了最新的人工智慧相關資訊。
Thumbnail
上週精選✦這篇文章是一份豐富的資訊,涵蓋了很多人工智慧相關的項目和新聞。包括了Figma Config 大會、Google 開源的Gemma 2、Claude 的更新等。此外還包含了各種產品推薦和重點研究。文章豐富而全面,充滿了最新的人工智慧相關資訊。
Thumbnail
生成式AI對話機器人產業市場預計在2030年達到36.2億美元。目前醫療保健、製造業、零售業與金融相關組織是採用生成式AI對話機器人的領先產業。文章介紹利用AI對話機器人(GeniAltX)能幫助個人及企業提升效率的情境與案例。企業正利用AI打造對話機器人,成為客戶服務或企業內部助理的關鍵角色。
Thumbnail
生成式AI對話機器人產業市場預計在2030年達到36.2億美元。目前醫療保健、製造業、零售業與金融相關組織是採用生成式AI對話機器人的領先產業。文章介紹利用AI對話機器人(GeniAltX)能幫助個人及企業提升效率的情境與案例。企業正利用AI打造對話機器人,成為客戶服務或企業內部助理的關鍵角色。
Thumbnail
Google最新發表了針對學習進行微調的Gemini新模型系列「LearnLM」,將學習科學原理融入模型及其支援的產品中,包括Google搜尋、Gems、YouTube和Google Classroom。這些新功能將對教育工作者和學習者產生深遠的影響。
Thumbnail
Google最新發表了針對學習進行微調的Gemini新模型系列「LearnLM」,將學習科學原理融入模型及其支援的產品中,包括Google搜尋、Gems、YouTube和Google Classroom。這些新功能將對教育工作者和學習者產生深遠的影響。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
在數位化的世界中,用戶介面和信息圖表等視覺元素扮演著越來越重要的角色,而ScreenAI的開發為自然語言處理和計算機視覺的融合開啟了新的可能性。
Thumbnail
在數位化的世界中,用戶介面和信息圖表等視覺元素扮演著越來越重要的角色,而ScreenAI的開發為自然語言處理和計算機視覺的融合開啟了新的可能性。
Thumbnail
人工智慧(AI)的未來展望 在當今這個科技日新月異的時代,人工智慧(AI)已成為推動創新和進步的重要力量。從自動駕駛汽車到精準醫療,AI的應用範圍不斷擴大,其潛力無限。然而,隨著AI技術的快速發展,我們也必須關注其對社會、經濟和倫理的影響。
Thumbnail
人工智慧(AI)的未來展望 在當今這個科技日新月異的時代,人工智慧(AI)已成為推動創新和進步的重要力量。從自動駕駛汽車到精準醫療,AI的應用範圍不斷擴大,其潛力無限。然而,隨著AI技術的快速發展,我們也必須關注其對社會、經濟和倫理的影響。
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News