Google Gemini 功能再進化,可以免費生成AI圖片

閱讀時間約 2 分鐘

Google推出AI聊天機器人Gemini加入生成圖像的功能,基於Imagen 2模型的圖像生成,讓使用者可以輸入文字描述,讓Google Gemini 生成相對應圖片。

Google秉持 AI 原則,圖像生成功能也是以負責任的方式進行開發設計。例如,為了確保 Gemini 生成的圖像,可以和原創藝術家的作品有明顯區別,Gemini 會使用 SynthID 工具,在生成圖像的像素中,嵌入數位可識別的浮水印來協助區別。

以下是我使用Google Gemini來生成及辨識圖像例子

生成圖片

只要輸入提示詞,就會生成相對應的圖片

在Google Gemini輸入英文提示詞生成圖像

在Google Gemini輸入英文提示詞生成圖像

點擊「生成更多內容」會再生成兩張圖像,最多生成四張

點擊「生成更多內容」生成更多圖像

點擊「生成更多內容」生成更多圖像

點擊圖片放大,可以下載圖片,圖片尺寸為512 x 512

Google Gemini 生成圖像尺寸512 x512

Google Gemini 生成圖像尺寸512 x512

也可以生成不同風格的照片,這邊生成吉卜力風格的圖像及貼紙

Google Gemini 生成吉卜力風格圖像

Google Gemini 生成吉卜力風格圖像

Google Gemini 生成貼紙圖像

Google Gemini 生成貼紙圖像

目前只支援使用英文描述生成圖片,如果你使用中文提示詞,系統會提示無法生成圖像。

Google Gemini無法使用中文生成圖像

Google Gemini無法使用中文生成圖像

描述圖片

以下是在Google Gemini分別上傳不同圖片風格及內容的描述

Google Gemini描述貓咪圖片

Google Gemini描述貓咪圖片

Google Gemini描述美食攝影圖片

Google Gemini描述美食攝影圖片

Google Gemini描述向量圖片

Google Gemini描述向量圖片

在描述的部分,準確度我覺得一半一半,對於人像的部分無論是卡通或真實風格,只要有人臉,Google Bard都無法處理

Google Gemini 無法描述人像圖片

Google Gemini 無法描述人像圖片

總結

我使用Google Gemini生成及描述圖像的功能進行了測試,效果還不錯,Gemini 能夠生成符合描述的圖像,且圖像的畫質清晰、色彩鮮豔,但在使用下來,有幾個小缺點:

  • 目前 Gemini 生成圖像的功能僅支援英文提示詞
  • 無法生成及辨識人像圖像
  • 辨識圖片功能在辨識圖片方面存在一定的誤差

我認為Google Gemini生成圖像的功能具有一定的潛力,該功能能夠生成逼真且符合描述的圖像,相信未來會更完善。

Google 也有獨立的免費生成高品質的圖像生成工具「ImageFX」,有興趣的也可以前往文章看看唷!

Google 在 2/8 將 Bard 聊天機器人命名為 Gemini

部分資料來源:Gemini

avatar-img
205會員
117內容數
主要是介紹各種AI工具,讓你輕鬆學會並應用,無論是圖像生成、文字編輯還是影片創作,這些工具都能事半功倍,為你節省寶貴時間,同時激發無限創意。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Stylar AI是一個輔助圖像生成工具,可以將我們的照片快速轉換成不同風格,提供超過40種風格做選擇,就像簡易版的Photoshop,有圖層管理、去背、選取、文字等多種功能,可以新增圖像素材,或是透過AI技術來生成圖層進行排版,輕鬆創造獨特的視覺作品。
Ideogram ai生成圖像工具,只需輸入文字描述,就可以輕鬆生成所需的圖像,能製作出精美的 Logo 及海報,最大的優勢在於可以生成使用者想要在圖像呈現的文字內容,也可根據之前生成的圖片,再次生成新的圖片,讓圖片趨近你想要的樣子。
Microsoft Copilot App 採用 GPT-4 大型語言模型,提供聊天、郵件撰寫、翻譯、提問、內容創作、學習新知識等多元功能。同時支援 DALL-E 3 自動生成圖像功能,無須登入帳號即可享用部分功能
Leonardo.AI 又有新功能「Image2Motion」,可以將你生成的圖片一鍵轉換為影片,能夠準確地捕捉圖片中的運動軌跡,生成流暢自然的動畫。
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Stylar AI是一個輔助圖像生成工具,可以將我們的照片快速轉換成不同風格,提供超過40種風格做選擇,就像簡易版的Photoshop,有圖層管理、去背、選取、文字等多種功能,可以新增圖像素材,或是透過AI技術來生成圖層進行排版,輕鬆創造獨特的視覺作品。
Ideogram ai生成圖像工具,只需輸入文字描述,就可以輕鬆生成所需的圖像,能製作出精美的 Logo 及海報,最大的優勢在於可以生成使用者想要在圖像呈現的文字內容,也可根據之前生成的圖片,再次生成新的圖片,讓圖片趨近你想要的樣子。
Microsoft Copilot App 採用 GPT-4 大型語言模型,提供聊天、郵件撰寫、翻譯、提問、內容創作、學習新知識等多元功能。同時支援 DALL-E 3 自動生成圖像功能,無須登入帳號即可享用部分功能
Leonardo.AI 又有新功能「Image2Motion」,可以將你生成的圖片一鍵轉換為影片,能夠準確地捕捉圖片中的運動軌跡,生成流暢自然的動畫。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
國泰CUBE App 整合外幣換匯、基金、證券等服務,提供簡便、低成本的美股定期定額投資解決方案。 5分鐘開戶、低投資門檻,幫助新手輕鬆進軍國際股市;提供人氣排行榜,讓投資人能夠掌握市場趨勢。
Thumbnail
Google Bard 最近推出了一系列新功能,不斷改進其生成式AI技術,這些新功能包括實時回覆和跳過回應等。 其中,新增的「實時回覆」功能使用戶在答案生成過程中可以逐句查看答案,而不必等到整個答案生成完畢才能看到。如果用戶不喜歡這一新功能,他們可以在Google Bard視窗右上角的設置圖示
Thumbnail
Bard API 是一個使用Google 最新的語言模型PaLM-2 的API,透過反向工程實現了對Bard AI 的使用。
Thumbnail
2023年Google Bard 正式開放支援繁體中文,並推出多項新功能,提供更個人化的回覆以及協助使用者提升效率。現在就來了解Bard有哪些特別功能,跟ChatGPT比有甚麼差異? Bard,一個來自Google AI的大型語言模型。其接受了大量的文字和程式碼訓練,能夠生成文
Thumbnail
微軟的ChatGPT大紅大紫,原來AI離我們這麼近,Google Bard也超強喔,歡迎體驗
Thumbnail
睽違一個月,Google Bard 迎來最新更新,此次一次更新許多重要功能,包含支援繁體中文、整合 Google Lens 服務提供使用者上傳圖片、語音朗讀以及其他功能增強等。
Thumbnail
Google 於前日(5月23日)公布最新的聊天機器人 Bard 更新:Bard 現在可以與 Google 搜尋引擎互動,依據使用者需求呈現圖片,以圖片形式提供有用的回應。換句話說,使用者可以直接向 Bard 搜尋圖片。每次提供圖片時,Bard 都會附上圖片來源。
AI 圈子裡隨著 Google Bard 公布讓 180 個國家測試後越來越熱鬧。我們此次選了 Google Bard, OpenAI GPT4 和 AI21 Jurassic 來對決,現存說一個笑話開始。
Thumbnail
google目前已開放台灣使用google bard AI 聊天機器人了,不知道為什麼新聞區沒消沒息的,照目前的風向應該是AI有點風吹草動立刻就會有舖天蓋地抄來抄去的新聞或部落格文章,但我特地查了一下確實無人提及此事。
Thumbnail
“Bard和ChatGPT都是大型語言模型,但它們各有優缺點。Bard更擅長回答問題和提供信息,而ChatGPT更擅長生成文本和創意內容。” 在教育方面,Bard可以用來幫助學生學習。它可以回答問題、為主題提供摘要,甚至生成練習題。 ChatGPT可以幫助學生進行創意寫作,例如生成詩歌、故事和劇本。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
國泰CUBE App 整合外幣換匯、基金、證券等服務,提供簡便、低成本的美股定期定額投資解決方案。 5分鐘開戶、低投資門檻,幫助新手輕鬆進軍國際股市;提供人氣排行榜,讓投資人能夠掌握市場趨勢。
Thumbnail
Google Bard 最近推出了一系列新功能,不斷改進其生成式AI技術,這些新功能包括實時回覆和跳過回應等。 其中,新增的「實時回覆」功能使用戶在答案生成過程中可以逐句查看答案,而不必等到整個答案生成完畢才能看到。如果用戶不喜歡這一新功能,他們可以在Google Bard視窗右上角的設置圖示
Thumbnail
Bard API 是一個使用Google 最新的語言模型PaLM-2 的API,透過反向工程實現了對Bard AI 的使用。
Thumbnail
2023年Google Bard 正式開放支援繁體中文,並推出多項新功能,提供更個人化的回覆以及協助使用者提升效率。現在就來了解Bard有哪些特別功能,跟ChatGPT比有甚麼差異? Bard,一個來自Google AI的大型語言模型。其接受了大量的文字和程式碼訓練,能夠生成文
Thumbnail
微軟的ChatGPT大紅大紫,原來AI離我們這麼近,Google Bard也超強喔,歡迎體驗
Thumbnail
睽違一個月,Google Bard 迎來最新更新,此次一次更新許多重要功能,包含支援繁體中文、整合 Google Lens 服務提供使用者上傳圖片、語音朗讀以及其他功能增強等。
Thumbnail
Google 於前日(5月23日)公布最新的聊天機器人 Bard 更新:Bard 現在可以與 Google 搜尋引擎互動,依據使用者需求呈現圖片,以圖片形式提供有用的回應。換句話說,使用者可以直接向 Bard 搜尋圖片。每次提供圖片時,Bard 都會附上圖片來源。
AI 圈子裡隨著 Google Bard 公布讓 180 個國家測試後越來越熱鬧。我們此次選了 Google Bard, OpenAI GPT4 和 AI21 Jurassic 來對決,現存說一個笑話開始。
Thumbnail
google目前已開放台灣使用google bard AI 聊天機器人了,不知道為什麼新聞區沒消沒息的,照目前的風向應該是AI有點風吹草動立刻就會有舖天蓋地抄來抄去的新聞或部落格文章,但我特地查了一下確實無人提及此事。
Thumbnail
“Bard和ChatGPT都是大型語言模型,但它們各有優缺點。Bard更擅長回答問題和提供信息,而ChatGPT更擅長生成文本和創意內容。” 在教育方面,Bard可以用來幫助學生學習。它可以回答問題、為主題提供摘要,甚至生成練習題。 ChatGPT可以幫助學生進行創意寫作,例如生成詩歌、故事和劇本。