Google Gemini 功能再進化,可以免費生成AI圖片

更新於 發佈於 閱讀時間約 2 分鐘

Google推出AI聊天機器人Gemini加入生成圖像的功能,基於Imagen 2模型的圖像生成,讓使用者可以輸入文字描述,讓Google Gemini 生成相對應圖片。

Google秉持 AI 原則,圖像生成功能也是以負責任的方式進行開發設計。例如,為了確保 Gemini 生成的圖像,可以和原創藝術家的作品有明顯區別,Gemini 會使用 SynthID 工具,在生成圖像的像素中,嵌入數位可識別的浮水印來協助區別。

以下是我使用Google Gemini來生成及辨識圖像例子

生成圖片

只要輸入提示詞,就會生成相對應的圖片

在Google Gemini輸入英文提示詞生成圖像

在Google Gemini輸入英文提示詞生成圖像

點擊「生成更多內容」會再生成兩張圖像,最多生成四張

點擊「生成更多內容」生成更多圖像

點擊「生成更多內容」生成更多圖像

點擊圖片放大,可以下載圖片,圖片尺寸為512 x 512

Google Gemini 生成圖像尺寸512 x512

Google Gemini 生成圖像尺寸512 x512

也可以生成不同風格的照片,這邊生成吉卜力風格的圖像及貼紙

Google Gemini 生成吉卜力風格圖像

Google Gemini 生成吉卜力風格圖像

Google Gemini 生成貼紙圖像

Google Gemini 生成貼紙圖像

目前只支援使用英文描述生成圖片,如果你使用中文提示詞,系統會提示無法生成圖像。

Google Gemini無法使用中文生成圖像

Google Gemini無法使用中文生成圖像

描述圖片

以下是在Google Gemini分別上傳不同圖片風格及內容的描述

Google Gemini描述貓咪圖片

Google Gemini描述貓咪圖片

Google Gemini描述美食攝影圖片

Google Gemini描述美食攝影圖片

Google Gemini描述向量圖片

Google Gemini描述向量圖片

在描述的部分,準確度我覺得一半一半,對於人像的部分無論是卡通或真實風格,只要有人臉,Google Bard都無法處理

Google Gemini 無法描述人像圖片

Google Gemini 無法描述人像圖片

總結

我使用Google Gemini生成及描述圖像的功能進行了測試,效果還不錯,Gemini 能夠生成符合描述的圖像,且圖像的畫質清晰、色彩鮮豔,但在使用下來,有幾個小缺點:

  • 目前 Gemini 生成圖像的功能僅支援英文提示詞
  • 無法生成及辨識人像圖像
  • 辨識圖片功能在辨識圖片方面存在一定的誤差

我認為Google Gemini生成圖像的功能具有一定的潛力,該功能能夠生成逼真且符合描述的圖像,相信未來會更完善。

Google 也有獨立的免費生成高品質的圖像生成工具「ImageFX」,有興趣的也可以前往文章看看唷!

Google 在 2/8 將 Bard 聊天機器人命名為 Gemini

部分資料來源:Gemini

avatar-img
222會員
123內容數
主要是介紹各種AI工具,讓你輕鬆學會並應用,無論是圖像生成、文字編輯還是影片創作,這些工具都能事半功倍,為你節省寶貴時間,同時激發無限創意。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Stylar AI是一個輔助圖像生成工具,可以將我們的照片快速轉換成不同風格,提供超過40種風格做選擇,就像簡易版的Photoshop,有圖層管理、去背、選取、文字等多種功能,可以新增圖像素材,或是透過AI技術來生成圖層進行排版,輕鬆創造獨特的視覺作品。
Ideogram ai生成圖像工具,只需輸入文字描述,就可以輕鬆生成所需的圖像,能製作出精美的 Logo 及海報,最大的優勢在於可以生成使用者想要在圖像呈現的文字內容,也可根據之前生成的圖片,再次生成新的圖片,讓圖片趨近你想要的樣子。
Microsoft Copilot App 採用 GPT-4 大型語言模型,提供聊天、郵件撰寫、翻譯、提問、內容創作、學習新知識等多元功能。同時支援 DALL-E 3 自動生成圖像功能,無須登入帳號即可享用部分功能
Leonardo.AI 又有新功能「Image2Motion」,可以將你生成的圖片一鍵轉換為影片,能夠準確地捕捉圖片中的運動軌跡,生成流暢自然的動畫。
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Stylar AI是一個輔助圖像生成工具,可以將我們的照片快速轉換成不同風格,提供超過40種風格做選擇,就像簡易版的Photoshop,有圖層管理、去背、選取、文字等多種功能,可以新增圖像素材,或是透過AI技術來生成圖層進行排版,輕鬆創造獨特的視覺作品。
Ideogram ai生成圖像工具,只需輸入文字描述,就可以輕鬆生成所需的圖像,能製作出精美的 Logo 及海報,最大的優勢在於可以生成使用者想要在圖像呈現的文字內容,也可根據之前生成的圖片,再次生成新的圖片,讓圖片趨近你想要的樣子。
Microsoft Copilot App 採用 GPT-4 大型語言模型,提供聊天、郵件撰寫、翻譯、提問、內容創作、學習新知識等多元功能。同時支援 DALL-E 3 自動生成圖像功能,無須登入帳號即可享用部分功能
Leonardo.AI 又有新功能「Image2Motion」,可以將你生成的圖片一鍵轉換為影片,能夠準確地捕捉圖片中的運動軌跡,生成流暢自然的動畫。
你可能也想看
Google News 追蹤
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Google在生成式AI模型的發展歷程中取得了多項重要成就。以下是Google生成式模型的主要發展里程碑: 早期基礎 (2006-2015) 2006年: Google推出Google Translate,這是一個使用機器學習進行自動翻譯的服務。 2015年: Google發布Te
Thumbnail
#gemini 今天發現,台灣的Gemini 用戶可以生圖片了(圖一),(但生成人物類不行!) 感覺生出來的比bing (圖2.3.4.5)呆板一點。 ~~~生成指令~~~ 生成一個產品圖片。 內容如下: 產品主體:WW2 1/6 英軍Matilda戰車模型玩具。 產品背景:各式裝備陳列開箱方
Thumbnail
Google已經把Gemini加到我們常用的工具欄中。 ​這代表著很多人搜尋不再只是依賴Google, 而是會直接使用Gemini!一場新的戰役即將展開: 以下是Gemini提供給各位SEO行銷者的建議⬇️ 1.內容價值的轉變 傳統的內容漸漸不再有用。 - 原創、高質量的內容Goog
Thumbnail
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Thumbnail
什麼是 Google Gemini? Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族,繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布,包括 Gemini Ultra、Pro 和 Nano,旨在超越 OpenAI 的 GPT-4
Thumbnail
Google Bard 最近推出了一系列新功能,不斷改進其生成式AI技術,這些新功能包括實時回覆和跳過回應等。 其中,新增的「實時回覆」功能使用戶在答案生成過程中可以逐句查看答案,而不必等到整個答案生成完畢才能看到。如果用戶不喜歡這一新功能,他們可以在Google Bard視窗右上角的設置圖示
Thumbnail
Bard API 是一個使用Google 最新的語言模型PaLM-2 的API,透過反向工程實現了對Bard AI 的使用。
Thumbnail
2023年Google Bard 正式開放支援繁體中文,並推出多項新功能,提供更個人化的回覆以及協助使用者提升效率。現在就來了解Bard有哪些特別功能,跟ChatGPT比有甚麼差異? Bard,一個來自Google AI的大型語言模型。其接受了大量的文字和程式碼訓練,能夠生成文
Thumbnail
微軟的ChatGPT大紅大紫,原來AI離我們這麼近,Google Bard也超強喔,歡迎體驗
Thumbnail
睽違一個月,Google Bard 迎來最新更新,此次一次更新許多重要功能,包含支援繁體中文、整合 Google Lens 服務提供使用者上傳圖片、語音朗讀以及其他功能增強等。
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Google在生成式AI模型的發展歷程中取得了多項重要成就。以下是Google生成式模型的主要發展里程碑: 早期基礎 (2006-2015) 2006年: Google推出Google Translate,這是一個使用機器學習進行自動翻譯的服務。 2015年: Google發布Te
Thumbnail
#gemini 今天發現,台灣的Gemini 用戶可以生圖片了(圖一),(但生成人物類不行!) 感覺生出來的比bing (圖2.3.4.5)呆板一點。 ~~~生成指令~~~ 生成一個產品圖片。 內容如下: 產品主體:WW2 1/6 英軍Matilda戰車模型玩具。 產品背景:各式裝備陳列開箱方
Thumbnail
Google已經把Gemini加到我們常用的工具欄中。 ​這代表著很多人搜尋不再只是依賴Google, 而是會直接使用Gemini!一場新的戰役即將展開: 以下是Gemini提供給各位SEO行銷者的建議⬇️ 1.內容價值的轉變 傳統的內容漸漸不再有用。 - 原創、高質量的內容Goog
Thumbnail
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Thumbnail
什麼是 Google Gemini? Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族,繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布,包括 Gemini Ultra、Pro 和 Nano,旨在超越 OpenAI 的 GPT-4
Thumbnail
Google Bard 最近推出了一系列新功能,不斷改進其生成式AI技術,這些新功能包括實時回覆和跳過回應等。 其中,新增的「實時回覆」功能使用戶在答案生成過程中可以逐句查看答案,而不必等到整個答案生成完畢才能看到。如果用戶不喜歡這一新功能,他們可以在Google Bard視窗右上角的設置圖示
Thumbnail
Bard API 是一個使用Google 最新的語言模型PaLM-2 的API,透過反向工程實現了對Bard AI 的使用。
Thumbnail
2023年Google Bard 正式開放支援繁體中文,並推出多項新功能,提供更個人化的回覆以及協助使用者提升效率。現在就來了解Bard有哪些特別功能,跟ChatGPT比有甚麼差異? Bard,一個來自Google AI的大型語言模型。其接受了大量的文字和程式碼訓練,能夠生成文
Thumbnail
微軟的ChatGPT大紅大紫,原來AI離我們這麼近,Google Bard也超強喔,歡迎體驗
Thumbnail
睽違一個月,Google Bard 迎來最新更新,此次一次更新許多重要功能,包含支援繁體中文、整合 Google Lens 服務提供使用者上傳圖片、語音朗讀以及其他功能增強等。