哪個AI繪圖工具最能聽懂人話?

閱讀時間約 4 分鐘
Whisper to your AI - by Midjourney
我在這篇文章之中介紹了幾個好用的繪圖工具,其實AI繪圖工具最吸引人的部分就是 "他能聽懂你的話,並且把你的話轉換成實際的圖片" ,這真的是一個非常神奇的過程,跟過去我們還要自己拿起滑鼠跟繪圖板相比,這實在是一個魔法時刻。
但是究竟AI工具是不是真的能聽得懂我們的人話呢? 還是其實只能拆解裡面的單字理解一部分而已呢? 我們今天就來做個簡單的測試,直接拿一模一樣的輸入(Prompt)餵給各種工具,讓我們來看看會得到怎樣的結果,就知道哪個AI工具最能聽懂人話囉! 既然要做測試,那我們就來選擇一個不能太單純的 Prompt, 有不只一個主詞(多個主體),然後也有動作,也包含環境跟敘述的Prompt。
我們今天選的是an artistic painting of a pretty girl standing underwater embracing 2 big fishes. 主詞有 A pretty girl 跟 2 big fishes, 動作是Embrace,環境是Underwater,繪畫的生成形勢是Artistic Painting。
第一個選手的就是我們的元老Dall-E,以下是產出來的結果
其實產出來的結果是讓我覺得吃驚的好,因為主詞完全正確,動作也完全正確,繪畫形式還有環境也很正確,但是Dall-E的弱點就是繪圖的細節跟美感不OK,人物的結構不算是太OK。
第二個選手是從Dall-E改變而來的Bing Image Creator,以下是結果
產出來的結果可以說是相當得不錯,主體(女孩跟兩隻魚)非常正確,動作上有一點問題,並沒有真正的Embrace (不過有另外幾張圖其實有做到這樣的動作只是相對構圖比較差),環境跟繪畫的形式也都完全正確,畫面的細節比Dall-E好多了。
第三個選手是插畫家最愛的Midjourney,以下為測試結果
好的,產出來結果在美感上真是無懈可擊,且在繪畫的形式還有環境上也呈現的非常完美,但是主體是一個女孩跟一堆魚? 而且說好的擁抱呢? 我重複嘗試了好幾次,雖然偶爾可以有正確的擁抱姿勢,但是永遠都會產出魚群來。
最後一個選手是我們之前談過的,最需要控制的Stable Diffusion,為了避免呈現完全沒有控制的Stable Diffusion 的圖片太醜,這次我用了比較美觀的Model加上一些修試圖片品質的Prompt,但是核心敘述是完全相同的,得到了以下的結果。
SD產出來的圖片只要經過正確的Prompt engineering跟參數選擇,充滿美感是沒問題的,但是主體跟Midjourney一樣弄不清楚”兩隻魚"的概念,而且Embrace這個動作呈現得更糟糕了,哪裡生出來的魚叉?
最後隱藏選手,這是2023/5/5才發表的DeepFloyd.Ai 採用的是Google 的Imagen模型,跟前面的選手都不同,最強的地方是終於可以生成正確的文字了,我把Prompt 偷偷加上了Pisces(雙魚座)這個文字,產出如下的圖片
可以看到對於文字的理解程度非常好,而且我希望他打出來的字完全正確! 不過這個畫質跟美感,應該還有很長一段路要走,總之是非常令人期待的,等到將來比較成熟以後,我也會把它列為正式的選手來做各種比較。
最後來總結一下,哪個工具最能聽懂人話呢? 依照我們的測試結果,Dall-E跟Bing Image Creator 是最佳的選擇,畢竟背後的Transformer model是由OpenAI(ChatGPT發明者)提供的,所以比較能理解你說的話看來不是隨便說說的,考量到美感問題應該Bing Image Creator是首選,再來的話可以考慮Midjourney,其實多測試修改幾次Prompt 應該都可以得到你想要的結果,無論要商用或是要寫文章配圖用,都還是非常實用的,而且完全不需要擔心美感。 最後的話就是我們的Stable Diffusion了,老實說能聽懂人話的部分不多,如果複雜的圖片(有包含多種人物 跟複雜動作的圖片)要得到好的結果,就必須要去學習一些進階的技巧才能達到效果。 以上,是今天簡短的分享,很希望大家也有學到一點東西,歡迎各位給我一些回饋囉!
為什麼會看到廣告
技術PM的AI實驗室,是以輕鬆的角度深入簡出的探討各種生成式AI工具的使用。無論你是想理解AI到底是怎麼運作的? 想知道有那些好用的生成式AI工具? 或者是對AI繪圖有興趣的,都歡迎加入我們的AI實驗室一起輕鬆地玩耍,我們邊玩邊學,學習跟AI一起共創新的可能。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
上次我們在這篇裡面提到了如何讓ChatGPT產出更為精確的答案,實際上就是透過三大原則加上一個小提示,本偏要補充一些很實用的方式,可以讓各位即使是比較複雜的任務,也可以讓ChatGPT替你完成。
在AI的術語之中,給AI的輸入問題叫做Prompt,而問出對AI來說好的問題,或是給AI精確的指示這門技術就叫做Prompt Engineering ,這跟寫程式一樣,是需要靠學習以及練習的。我們來淺談一下這個Prompt Engineering的基本,也就是怎麼問出好的問題。
對於還完全沒有AI繪圖經驗的你,該怎麼開始呢? 很簡單,就是開始”玩”! 先從動手開始隨便玩,讓想像力帶著你到處跑,在今天這篇文章裡面我會把幾個比較熱門的AI繪圖網站/工具介紹給你,你可以不要有任何心理壓力的開始玩玩看,看看能得到什麼有趣的結果。
AI人工智慧跟一般的演算法差別在哪邊呢? 本篇就是要告訴你 為什麼無所不能ChatGPT,上知天文下知地理,可是就是有一個很明顯的弱點,請他算數學卻很常算錯,明明這個ChatGPT 充滿想像力,請他寫演講稿,草擬策略都很在行,為什麼數學就是不行呢?
這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,講解各個各位聽聽AI繪圖的箇中道理。
到底該學習什麼AI的工具呢? 有一次在PODCAST上偶爾然聽到有人分享,該如何有系統的利用3W1H來解決問題,也談到了關於AI工具之類的想法,所以我這邊稍微做了點整理,作為我這邊探討AI工具的開端。
上次我們在這篇裡面提到了如何讓ChatGPT產出更為精確的答案,實際上就是透過三大原則加上一個小提示,本偏要補充一些很實用的方式,可以讓各位即使是比較複雜的任務,也可以讓ChatGPT替你完成。
在AI的術語之中,給AI的輸入問題叫做Prompt,而問出對AI來說好的問題,或是給AI精確的指示這門技術就叫做Prompt Engineering ,這跟寫程式一樣,是需要靠學習以及練習的。我們來淺談一下這個Prompt Engineering的基本,也就是怎麼問出好的問題。
對於還完全沒有AI繪圖經驗的你,該怎麼開始呢? 很簡單,就是開始”玩”! 先從動手開始隨便玩,讓想像力帶著你到處跑,在今天這篇文章裡面我會把幾個比較熱門的AI繪圖網站/工具介紹給你,你可以不要有任何心理壓力的開始玩玩看,看看能得到什麼有趣的結果。
AI人工智慧跟一般的演算法差別在哪邊呢? 本篇就是要告訴你 為什麼無所不能ChatGPT,上知天文下知地理,可是就是有一個很明顯的弱點,請他算數學卻很常算錯,明明這個ChatGPT 充滿想像力,請他寫演講稿,草擬策略都很在行,為什麼數學就是不行呢?
這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,講解各個各位聽聽AI繪圖的箇中道理。
到底該學習什麼AI的工具呢? 有一次在PODCAST上偶爾然聽到有人分享,該如何有系統的利用3W1H來解決問題,也談到了關於AI工具之類的想法,所以我這邊稍微做了點整理,作為我這邊探討AI工具的開端。
你可能也想看
Google News 追蹤
Thumbnail
上次在 "AI繪圖提示詞苦手嗎" 就有請 AI 幫忙過了,這次想再分享一下,這兩天一個蠻有趣經驗,給您參考。 我這兩天一直想畫可愛的小狗站著散步,如上圖,但,一剛開始,出圖效果不好...
Thumbnail
AI 繪圖的浪潮席捲而來,如何在沒有靈感時使用聊天機器人找到靈感?此篇分享如何透過ChatGPT來尋求AI幫助生成創意點子,並分享了實例、圖像生成和創作過程。
Thumbnail
透過學習與AI對話,讓它產出我們想要的圖像,將會是一個引人入勝的過程。在這篇文章中,我們將探討如何使用AI創作出簡潔明亮風格的心靈富足、光明、溫暖圖像,並加入付出與給予的元素。
Thumbnail
我問AI: 「心如大海無邊際,廣植淨蓮養身心; 自有一雙無事手,為作世間慈悲人。」 如果要你畫出上面詩偈的感覺,你要畫给我什麼樣的畫? 它給我四張圖回答我: 您覺得AI對這首偈語的感受程度有夠水準嗎?
Thumbnail
腦子一在思考一個問題,什麼是意境?什麼是情境?什麼是情景?差別在哪裡? ▪︎因為地震波動,魚兒們跳出水面。 ▪︎時間:2024/04/05 ▪︎工具:Bing Dall-E3 Copilot 視覺描述: 1. 主角:魚兒們 2. 動作:跳出水面 3. 背景:地震波動
Thumbnail
DeepAI 提供「聊天機器人」及「生成圖像」兩種服務,不用註冊就可以免費使用,聊天機器人有多種角色做選擇,能為你的創作和思考過程帶來新的靈感;至於圖像生成功能,也提供多種風格供你選擇,讓你每次生成的圖像都有不同的風格和特色。
Thumbnail
AI 繪圖是一種利用人工智慧技術,根據文字描述,生成出各種風格和主題的圖片的方法,不僅可以讓你實現你的想像力,還可以讓你了解到 AI 的創造力。
Thumbnail
這篇文章精選了三款必備的AI繪圖工具,包括MidJourney、DALL·E和Stable Diffusion。這些工具提供了豐富的創作可能性,讓使用者能夠輕鬆地以AI技術創作各種繪畫作品。
Thumbnail
可能包含敏感內容
這篇文章介紹了Bing產生的圖片在唯美氣質風方面的表現,並探討了DALL E-3在語言解析和生成圖方面的強大能力。文章展望了未來AI在繪圖方面的潛力和發展方向。
Thumbnail
隨著科技發展,AI技術成就卓越,尤其AI生成器在繪圖、文案和影片創作中蓬勃興起。本文深入介紹領先AI生成器,重點關注MyEdit的免費AI繪圖工具,以及Midjourney、Fotor、Artguru等出色選擇。這些工具讓用戶輕鬆將文字、指令轉換成驚豔的繪畫、影片和文案,為創意提供無盡可能。
Thumbnail
上次在 "AI繪圖提示詞苦手嗎" 就有請 AI 幫忙過了,這次想再分享一下,這兩天一個蠻有趣經驗,給您參考。 我這兩天一直想畫可愛的小狗站著散步,如上圖,但,一剛開始,出圖效果不好...
Thumbnail
AI 繪圖的浪潮席捲而來,如何在沒有靈感時使用聊天機器人找到靈感?此篇分享如何透過ChatGPT來尋求AI幫助生成創意點子,並分享了實例、圖像生成和創作過程。
Thumbnail
透過學習與AI對話,讓它產出我們想要的圖像,將會是一個引人入勝的過程。在這篇文章中,我們將探討如何使用AI創作出簡潔明亮風格的心靈富足、光明、溫暖圖像,並加入付出與給予的元素。
Thumbnail
我問AI: 「心如大海無邊際,廣植淨蓮養身心; 自有一雙無事手,為作世間慈悲人。」 如果要你畫出上面詩偈的感覺,你要畫给我什麼樣的畫? 它給我四張圖回答我: 您覺得AI對這首偈語的感受程度有夠水準嗎?
Thumbnail
腦子一在思考一個問題,什麼是意境?什麼是情境?什麼是情景?差別在哪裡? ▪︎因為地震波動,魚兒們跳出水面。 ▪︎時間:2024/04/05 ▪︎工具:Bing Dall-E3 Copilot 視覺描述: 1. 主角:魚兒們 2. 動作:跳出水面 3. 背景:地震波動
Thumbnail
DeepAI 提供「聊天機器人」及「生成圖像」兩種服務,不用註冊就可以免費使用,聊天機器人有多種角色做選擇,能為你的創作和思考過程帶來新的靈感;至於圖像生成功能,也提供多種風格供你選擇,讓你每次生成的圖像都有不同的風格和特色。
Thumbnail
AI 繪圖是一種利用人工智慧技術,根據文字描述,生成出各種風格和主題的圖片的方法,不僅可以讓你實現你的想像力,還可以讓你了解到 AI 的創造力。
Thumbnail
這篇文章精選了三款必備的AI繪圖工具,包括MidJourney、DALL·E和Stable Diffusion。這些工具提供了豐富的創作可能性,讓使用者能夠輕鬆地以AI技術創作各種繪畫作品。
Thumbnail
可能包含敏感內容
這篇文章介紹了Bing產生的圖片在唯美氣質風方面的表現,並探討了DALL E-3在語言解析和生成圖方面的強大能力。文章展望了未來AI在繪圖方面的潛力和發展方向。
Thumbnail
隨著科技發展,AI技術成就卓越,尤其AI生成器在繪圖、文案和影片創作中蓬勃興起。本文深入介紹領先AI生成器,重點關注MyEdit的免費AI繪圖工具,以及Midjourney、Fotor、Artguru等出色選擇。這些工具讓用戶輕鬆將文字、指令轉換成驚豔的繪畫、影片和文案,為創意提供無盡可能。