Gemini 是什麼?關於 Google Gemini 你必須知道的 7 件事

更新於 發佈於 閱讀時間約 11 分鐘

Gemini 是什麼?由 Google 打造的多模態大型語言模型

Gemini 是 Google 打造的全新一代人工智慧模型,也是目前最具野心的多模態 AI 系統之一。不同於傳統只能處理文字的語言模型,Gemini 可以同時理解與處理文字、圖片、影片、程式碼甚至聲音,具備跨領域的理解與推理能力。簡單來說,它不只是「會聊天的 AI」,而是可以根據各種資料來源做出分析、生成內容,甚至協助解決實際問題的智慧助手。

Gemini 最早在 2023 年底以 Gemini 1.0 系列問世,後續又推出性能更強的 Gemini 1.5,具備長上下文處理能力,最多可理解超過 100 萬個 token 的資訊量。 100 萬個 token 就差不多代表它可以閱讀一本書、深入分析多頁 PDF 報告,甚至理解大型的程式碼專案。

目前,Gemini 已整合到 Google 的多項產品中,例如 Pixel 手機內建的 AI 助理、Google Workspace(如 Gmail、Docs)的智慧工具,甚至是 Android 系統本身。無論是撰寫郵件、整理會議記錄、或透過語音指令操作裝置,都能看到 Gemini 的身影。

關於 Gemini 你必須知道的 7 件事

一、Gemini 一開始叫做 「Bard」

在 Gemini 出現之前,Google 曾推出一款名為 Bard 的聊天機器人,這款工具於 2023 年 3 月正式問世,當時是為了回應 ChatGPT 引發的生成式 AI 熱潮。Bard 最初是基於 Google 內部開發的語言模型 LaMDA(Language Model for Dialogue Applications) 所構建,主打能夠進行自然且具邏輯性的對話。隨著需求擴大,Google 也逐步將 Bard 升級為使用 PaLM 2 模型,使其具備更強的語言理解與多語言支援能力。

然而,隨著多模態 AI 技術快速演進,Bard 漸漸顯得侷限。2023 年底,Google 宣布進一步推出全新架構的 Gemini 模型,正式取代 Bard 的位置,並將產品品牌統一改名為 Gemini。新的 Gemini 系列不再只處理文字輸入,而是具備多模態能力,能同時理解圖片、影片、語音和程式碼。這也象徵 Google 從單一聊天工具,正式邁向全方位 AI 平台的轉型。

二、Gemini 支援多模態輸入,能一次處理多種資料型態

Google Gemini 是建立在 Transformer 架構之上的大型語言模型,但它的能力遠不只處理文字。與早期模型相比,Gemini 支援「多模態輸入」,也就是說,它可以同時理解文字、圖片、聲音、影片,甚至是程式碼,並將這些不同型態的資訊融合起來進行分析與生成。舉例來說,Gemini 能一邊閱讀文件、一邊解析圖表,甚至根據影片內容進行摘要或問答。

為了達到這樣的能力,Gemini 採用了龐大的多語言、多模態資料進行訓練,這些資料來自各種開放網路資源和資料集,幫助模型更貼近真實世界的複雜情境。其核心運作原理之一是「自注意力機制」(Self-Attention),這項技術讓 Gemini 在處理大量資訊時,能自動找出哪些細節最關鍵、哪些內容彼此有關聯。

三、Gemini 可以做什麼?Google Gemini 的多種版本

Google Gemini 是一個涵蓋多種用途與設備的 AI 模型系列,針對不同運算需求與應用場景,推出了多個版本,從手機上的輕量模型到雲端高效能版本都有。以下是目前 Google 已公開的版本與特點: 

 Gemini 1.0 系列(2023 年 12 月) 

  • 1.0 Nano:裝置端輕量模型,已部署於 Pixel 8 Pro。
  • 1.0 Pro(在 Bard 中使用):Google 官方服務的預設模型。
  • 1.0 Ultra:最強大的雲端版模型,用於複雜任務與多模態應用。

 Gemini 1.5 系列  (2024 年 2 月 )

  • 1.5 Pro:支援超長上下文(最多 100 萬 token),適合更複雜推理工作
  • 1.5 Flash:在各種任務中提供快速且多功能的效能

Gemini 2.0 系列(2024 年 12 月 )

  • 2.0 Flash:新一代功能、速度、思考、即時串流和多模態生成

 Gemini 2.5 系列(即將推出)

  • 2.5 Pro:強化思考和推理、多模態理解、進階程式設計等功能
  • 2.5 Flash:適應性思考、成本效益

四、ChatGPT 跟 Gemini 哪個好用?Gemini 跟其他模型的性能比較

Google Gemini 和 OpenAI 的 ChatGPT 是目前兩大主流的生成式 AI 模型,兩者雖然都是大型語言模型(LLM),但在功能設計與使用體驗上各有優勢。根據 Tom’s Guide 和 Backlinko 等評測資料,這兩款工具在不同任務下的表現有所差異,選擇哪一個更好,取決於使用者的需求。

在創意寫作方面,如故事創作、行銷文案或社群貼文撰寫,ChatGPT 尤其是 GPT-4 模型,展現出更流暢自然的語言風格與情感掌握力,特別適合長篇寫作與模擬角色上。在程式碼應用上,兩者皆支援多種程式語言,但 GPT-4 Turbo 對 Debug 以及優化程式碼的表現相較穩定,比較適合開發者使用。

反觀 Gemini 在多模態處理(如圖片辨識、影片摘要、圖像生成提示)上有顯著優勢,特別是在快速輸入處理和反應速度方面表現突出,能即時回應複雜的提問。此外,Gemini 的介面整合了許多 Google 服務,對於熟悉 Google 生態系的用戶更直覺便利。

如果你重視創意寫作、自然語言流暢度與語境掌握,ChatGPT 是首選;但若你需要整合多媒體資訊或追求即時互動效率,Gemini 則提供了更多元且強大的功能支援。

五、Google 目前哪些服務已經開始應用 Gemini?

Google Gemini 不只是單一的聊天工具,而是一套廣泛整合在 Google 生態系中的 AI 技術。從個人裝置到企業服務,Gemini 正逐步成為核心智慧助理,提升使用者在工作與生活上的效率。

目前,Google Pixel 手機是最早導入 Gemini 的裝置。以 Pixel 8 Pro 為例,手機中的智慧回覆(Smart Reply)、即時摘要與語音轉文字功能,都透過 Gemini Nano 在裝置端即時處理,提升速度與隱私保護。

在辦公應用方面,Google Workspace 也大量整合 Gemini 功能。使用者在 Gmail 和 Google Docs 中,可以看到「Help me write」或「幫我撰寫」的功能,透過 Gemini 協助生成郵件草稿、編輯文件、摘要會議內容等。此外,在 Google Sheets 中也能透過自然語言快速建立工作表格式,或者分析數據的趨勢。

Google 也正在將 Gemini 應用擴展至 Google Maps、YouTube、Android 系統設定等領域,例如在 Maps 中提供更個人化的推薦與旅遊建議,在 YouTube 協助摘要影片內容與標題生成。這些整合顯示,Gemini 並非單點功能,而是一種可深入嵌入日常工作與娛樂流程的 AI 助理。

六、台灣可以用Gemini嗎?Gemini 是免費使用的嗎?

Google Gemini 現在已正式開放台灣用戶使用,所以台灣是可以使用 Gemini 的。從 2024 年 5 月起,無論是透過電腦的網頁瀏覽器(gemini.google.com),還是 Android 系統中的 Gemini App,台灣地區都能直接體驗這項 AI 工具。iOS 用戶則可以透過 Google App 使用內建的 Gemini 聊天功能,無需額外下載應用程式。

截至 2025 年 4 月,Gemini 提供 免費版與付費版(Gemini Advanced) 兩種選擇:

免費版 Gemini(NT$0/月)

  • 採用 Gemini 1.5 Flash 模型,適合日常寫作、查詢、程式輔助與基本圖文處理。
  • 支援 Gemini Live(語音對話)、Gems(自訂 AI 助手)、Gemini Canvas(互動式創作空間)。
  • 提供有限的 Deep Research 功能與對 Gemini 2.5 Pro 的實驗性存取權限。

付費版 Gemini Advanced(NT$650/月,首月免費)

  • 採用 Gemini 2.5 Pro 模型,具備更長上下文處理能力與更強生成品質。
  • 支援一次上傳最多 1,500 頁檔案、讀懂大型報告與書籍。
  • 解鎖完整 Deep Research 功能、程式碼庫上傳分析、Veo 2 影片生成與 Whisk Animate 等創作工具。
  • 內含 Google One 2TB 儲存空間與 NotebookLM Plus 的高級功能。
  • 可在 Gmail、Docs 等應用中整合使用。

七、Gemini 怎麼叫出來?如何使用 Google Gemini?

要使用 Google Gemini 其實非常簡單。用瀏覽器進入 gemini.google.com,登入 Google 帳號後即可使用。如果你是 Android 用戶,也可以在 Google Play 商店中下載 Gemini App,部分新版 Android 系統中甚至已內建 Gemini 助理,能取代原有的 Google Assistant。iOS 用戶則可透過 Google App 內的 Gemini 功能進行互動,不需要額外安裝其他的應用程式。

🔻進入 Gemini 後,左上角可以選擇 Gemini 版本(各版本優勢請見 Google Gemini 的多種版本)。

raw-image


🔻選擇版本後可以直接輸入 PROMPT,例如「以下是 XXX 的報告,請幫我列出這份報告的 5 個重點」或「請幫我將以下英文翻譯成繁體中文」。如果你有圖片、PDF 或其他檔案想讓 Gemini 協助理解,也可直接上傳至對話框,Gemini 支援多模態處理,能結合圖文資料提供完整回應。

raw-image


🔻此外,Gemini 還提供「Canvas」模式,在單一空間中進行寫作、程式碼撰寫、編輯與 AI 對話,適合需要高集中度創作的人使用。(Canvas 使用上非常直覺,體驗也相當不錯,十分建議可以玩玩看!)

raw-image


文章未完,閱讀全文👇



留言
avatar-img
留言分享你的想法!
avatar-img
PressPlay Academy|線上課程學習平台的沙龍
0會員
13內容數
2025/06/12
AI Agent 是什麼?AI Agent 的定義 AI Agent 的中文是「AI 代理」,是一種能自動幫你完成任務的人工智慧系統。 它不只是像傳統的聊天機器人(Chatbot)一樣回答問題,而是可以自己思考、自己找資料,甚至一步一步自主完成任務。 人類只需要設定一個最終目標,AI Agen
Thumbnail
2025/06/12
AI Agent 是什麼?AI Agent 的定義 AI Agent 的中文是「AI 代理」,是一種能自動幫你完成任務的人工智慧系統。 它不只是像傳統的聊天機器人(Chatbot)一樣回答問題,而是可以自己思考、自己找資料,甚至一步一步自主完成任務。 人類只需要設定一個最終目標,AI Agen
Thumbnail
2025/06/11
紫微斗數是什麼? 紫微斗數是源自中國古代的一種命理工具,會根據一個人的出生年月日和時辰(也就是生辰八字)來排出一張命盤,命盤上有十二個宮位,可以用來分析一個人的個性、運勢以及人生發展。 這門學問結合了天文觀測和易經理論,核心思想是「天人合一」,也就是天上的星象和人間的事會互相影響。跟其他命理系統
Thumbnail
2025/06/11
紫微斗數是什麼? 紫微斗數是源自中國古代的一種命理工具,會根據一個人的出生年月日和時辰(也就是生辰八字)來排出一張命盤,命盤上有十二個宮位,可以用來分析一個人的個性、運勢以及人生發展。 這門學問結合了天文觀測和易經理論,核心思想是「天人合一」,也就是天上的星象和人間的事會互相影響。跟其他命理系統
Thumbnail
2025/06/10
Perplexity 是什麼?一款結合 AI 和搜尋的工具 Perplexity 是一款結合 AI 和即時網路搜尋的工具,能快速給出正確、有來源的答案。跟傳統搜尋引擎不一樣,它不是只列出一堆連結,而是直接整理好重點回答,還會附上資訊來源,讓使用者不用一個一個點開連結,就能馬上找到需要的內容。 P
Thumbnail
2025/06/10
Perplexity 是什麼?一款結合 AI 和搜尋的工具 Perplexity 是一款結合 AI 和即時網路搜尋的工具,能快速給出正確、有來源的答案。跟傳統搜尋引擎不一樣,它不是只列出一堆連結,而是直接整理好重點回答,還會附上資訊來源,讓使用者不用一個一個點開連結,就能馬上找到需要的內容。 P
Thumbnail
看更多
你可能也想看
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
Google Meet 即將推出全新 AI 驅動的 "Take notes for me" 功能,自動記錄會議筆記。 適用於Gemini Enterprise、Education Premium 或 AI Meetings & Messaging 加值服務的 Google Workspace 用戶。
Thumbnail
Google Meet 即將推出全新 AI 驅動的 "Take notes for me" 功能,自動記錄會議筆記。 適用於Gemini Enterprise、Education Premium 或 AI Meetings & Messaging 加值服務的 Google Workspace 用戶。
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
GENAI是一個強大的AI系統,利用鋼彈戰機的比喻方式來解釋其運作原理。本文介紹了大型語言模型如同鋼彈系統的動力核心、武器系統以及導航系統等元素,以幫助讀者更深入理解GENAI的複雜結構和功能。
Thumbnail
GENAI是一個強大的AI系統,利用鋼彈戰機的比喻方式來解釋其運作原理。本文介紹了大型語言模型如同鋼彈系統的動力核心、武器系統以及導航系統等元素,以幫助讀者更深入理解GENAI的複雜結構和功能。
Thumbnail
AI -Gemini : 我鼓勵你探索自己的答案,並找到讓你感到充實和意義的東西。 我的 AI -Gemini 無法回答我全部的問題... “我從哪裡來?” “現在發生的事情的品質如何?” AI -Gemini : 我是一個由 Google AI 創建的大型語言模型,在大量文字和程式碼...
Thumbnail
AI -Gemini : 我鼓勵你探索自己的答案,並找到讓你感到充實和意義的東西。 我的 AI -Gemini 無法回答我全部的問題... “我從哪裡來?” “現在發生的事情的品質如何?” AI -Gemini : 我是一個由 Google AI 創建的大型語言模型,在大量文字和程式碼...
Thumbnail
在這個資訊爆炸的時代,我們每天都會接觸到大量的資訊。然而,要從中找到我們真正需要的信息,卻並非易事。此外,我們的工作和生活中也常常需要進行一些繁瑣的任務,例如寫作、翻譯、搜索等。這些任務往往耗時費力,讓人感到疲憊不堪。推薦最強的AI助理Monica、‎Gemini、Recraft圖片或ICON創作
Thumbnail
在這個資訊爆炸的時代,我們每天都會接觸到大量的資訊。然而,要從中找到我們真正需要的信息,卻並非易事。此外,我們的工作和生活中也常常需要進行一些繁瑣的任務,例如寫作、翻譯、搜索等。這些任務往往耗時費力,讓人感到疲憊不堪。推薦最強的AI助理Monica、‎Gemini、Recraft圖片或ICON創作
Thumbnail
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Thumbnail
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Thumbnail
什麼是 Google Gemini? Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族,繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布,包括 Gemini Ultra、Pro 和 Nano,旨在超越 OpenAI 的 GPT-4
Thumbnail
什麼是 Google Gemini? Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族,繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布,包括 Gemini Ultra、Pro 和 Nano,旨在超越 OpenAI 的 GPT-4
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Thumbnail
2024 年,AI Boom 的第二年,我們總算可以撥開 AI 迷霧,逐一聊聊大型語言模型 (LLM) 的實際應用。On-Device AI 正快速進化,Google Gemini Nano 正式部署上手機,Apple 也發布最新論文彎道超車,改變了手機 AI 的未來發展。
Thumbnail
2024 年,AI Boom 的第二年,我們總算可以撥開 AI 迷霧,逐一聊聊大型語言模型 (LLM) 的實際應用。On-Device AI 正快速進化,Google Gemini Nano 正式部署上手機,Apple 也發布最新論文彎道超車,改變了手機 AI 的未來發展。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News