哪個AI繪圖工具最能聽懂人話?

閱讀時間約 4 分鐘
Whisper to your AI - by Midjourney
我在這篇文章之中介紹了幾個好用的繪圖工具,其實AI繪圖工具最吸引人的部分就是 "他能聽懂你的話,並且把你的話轉換成實際的圖片" ,這真的是一個非常神奇的過程,跟過去我們還要自己拿起滑鼠跟繪圖板相比,這實在是一個魔法時刻。
但是究竟AI工具是不是真的能聽得懂我們的人話呢? 還是其實只能拆解裡面的單字理解一部分而已呢? 我們今天就來做個簡單的測試,直接拿一模一樣的輸入(Prompt)餵給各種工具,讓我們來看看會得到怎樣的結果,就知道哪個AI工具最能聽懂人話囉! 既然要做測試,那我們就來選擇一個不能太單純的 Prompt, 有不只一個主詞(多個主體),然後也有動作,也包含環境跟敘述的Prompt。
我們今天選的是an artistic painting of a pretty girl standing underwater embracing 2 big fishes. 主詞有 A pretty girl 跟 2 big fishes, 動作是Embrace,環境是Underwater,繪畫的生成形勢是Artistic Painting。
第一個選手的就是我們的元老Dall-E,以下是產出來的結果
其實產出來的結果是讓我覺得吃驚的好,因為主詞完全正確,動作也完全正確,繪畫形式還有環境也很正確,但是Dall-E的弱點就是繪圖的細節跟美感不OK,人物的結構不算是太OK。
第二個選手是從Dall-E改變而來的Bing Image Creator,以下是結果
產出來的結果可以說是相當得不錯,主體(女孩跟兩隻魚)非常正確,動作上有一點問題,並沒有真正的Embrace (不過有另外幾張圖其實有做到這樣的動作只是相對構圖比較差),環境跟繪畫的形式也都完全正確,畫面的細節比Dall-E好多了。
第三個選手是插畫家最愛的Midjourney,以下為測試結果
好的,產出來結果在美感上真是無懈可擊,且在繪畫的形式還有環境上也呈現的非常完美,但是主體是一個女孩跟一堆魚? 而且說好的擁抱呢? 我重複嘗試了好幾次,雖然偶爾可以有正確的擁抱姿勢,但是永遠都會產出魚群來。
最後一個選手是我們之前談過的,最需要控制的Stable Diffusion,為了避免呈現完全沒有控制的Stable Diffusion 的圖片太醜,這次我用了比較美觀的Model加上一些修試圖片品質的Prompt,但是核心敘述是完全相同的,得到了以下的結果。
SD產出來的圖片只要經過正確的Prompt engineering跟參數選擇,充滿美感是沒問題的,但是主體跟Midjourney一樣弄不清楚”兩隻魚"的概念,而且Embrace這個動作呈現得更糟糕了,哪裡生出來的魚叉?
最後隱藏選手,這是2023/5/5才發表的DeepFloyd.Ai 採用的是Google 的Imagen模型,跟前面的選手都不同,最強的地方是終於可以生成正確的文字了,我把Prompt 偷偷加上了Pisces(雙魚座)這個文字,產出如下的圖片
可以看到對於文字的理解程度非常好,而且我希望他打出來的字完全正確! 不過這個畫質跟美感,應該還有很長一段路要走,總之是非常令人期待的,等到將來比較成熟以後,我也會把它列為正式的選手來做各種比較。
最後來總結一下,哪個工具最能聽懂人話呢? 依照我們的測試結果,Dall-E跟Bing Image Creator 是最佳的選擇,畢竟背後的Transformer model是由OpenAI(ChatGPT發明者)提供的,所以比較能理解你說的話看來不是隨便說說的,考量到美感問題應該Bing Image Creator是首選,再來的話可以考慮Midjourney,其實多測試修改幾次Prompt 應該都可以得到你想要的結果,無論要商用或是要寫文章配圖用,都還是非常實用的,而且完全不需要擔心美感。 最後的話就是我們的Stable Diffusion了,老實說能聽懂人話的部分不多,如果複雜的圖片(有包含多種人物 跟複雜動作的圖片)要得到好的結果,就必須要去學習一些進階的技巧才能達到效果。 以上,是今天簡短的分享,很希望大家也有學到一點東西,歡迎各位給我一些回饋囉!
為什麼會看到廣告
技術PM的AI實驗室,是以輕鬆的角度深入簡出的探討各種生成式AI工具的使用。無論你是想理解AI到底是怎麼運作的? 想知道有那些好用的生成式AI工具? 或者是對AI繪圖有興趣的,都歡迎加入我們的AI實驗室一起輕鬆地玩耍,我們邊玩邊學,學習跟AI一起共創新的可能。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
上次我們在這篇裡面提到了如何讓ChatGPT產出更為精確的答案,實際上就是透過三大原則加上一個小提示,本偏要補充一些很實用的方式,可以讓各位即使是比較複雜的任務,也可以讓ChatGPT替你完成。
在AI的術語之中,給AI的輸入問題叫做Prompt,而問出對AI來說好的問題,或是給AI精確的指示這門技術就叫做Prompt Engineering ,這跟寫程式一樣,是需要靠學習以及練習的。我們來淺談一下這個Prompt Engineering的基本,也就是怎麼問出好的問題。
對於還完全沒有AI繪圖經驗的你,該怎麼開始呢? 很簡單,就是開始”玩”! 先從動手開始隨便玩,讓想像力帶著你到處跑,在今天這篇文章裡面我會把幾個比較熱門的AI繪圖網站/工具介紹給你,你可以不要有任何心理壓力的開始玩玩看,看看能得到什麼有趣的結果。
AI人工智慧跟一般的演算法差別在哪邊呢? 本篇就是要告訴你 為什麼無所不能ChatGPT,上知天文下知地理,可是就是有一個很明顯的弱點,請他算數學卻很常算錯,明明這個ChatGPT 充滿想像力,請他寫演講稿,草擬策略都很在行,為什麼數學就是不行呢?
這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,講解各個各位聽聽AI繪圖的箇中道理。
到底該學習什麼AI的工具呢? 有一次在PODCAST上偶爾然聽到有人分享,該如何有系統的利用3W1H來解決問題,也談到了關於AI工具之類的想法,所以我這邊稍微做了點整理,作為我這邊探討AI工具的開端。
上次我們在這篇裡面提到了如何讓ChatGPT產出更為精確的答案,實際上就是透過三大原則加上一個小提示,本偏要補充一些很實用的方式,可以讓各位即使是比較複雜的任務,也可以讓ChatGPT替你完成。
在AI的術語之中,給AI的輸入問題叫做Prompt,而問出對AI來說好的問題,或是給AI精確的指示這門技術就叫做Prompt Engineering ,這跟寫程式一樣,是需要靠學習以及練習的。我們來淺談一下這個Prompt Engineering的基本,也就是怎麼問出好的問題。
對於還完全沒有AI繪圖經驗的你,該怎麼開始呢? 很簡單,就是開始”玩”! 先從動手開始隨便玩,讓想像力帶著你到處跑,在今天這篇文章裡面我會把幾個比較熱門的AI繪圖網站/工具介紹給你,你可以不要有任何心理壓力的開始玩玩看,看看能得到什麼有趣的結果。
AI人工智慧跟一般的演算法差別在哪邊呢? 本篇就是要告訴你 為什麼無所不能ChatGPT,上知天文下知地理,可是就是有一個很明顯的弱點,請他算數學卻很常算錯,明明這個ChatGPT 充滿想像力,請他寫演講稿,草擬策略都很在行,為什麼數學就是不行呢?
這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,講解各個各位聽聽AI繪圖的箇中道理。
到底該學習什麼AI的工具呢? 有一次在PODCAST上偶爾然聽到有人分享,該如何有系統的利用3W1H來解決問題,也談到了關於AI工具之類的想法,所以我這邊稍微做了點整理,作為我這邊探討AI工具的開端。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
在這個資訊爆炸的時代,我們每天都會接觸到大量的資訊。然而,要從中找到我們真正需要的信息,卻並非易事。此外,我們的工作和生活中也常常需要進行一些繁瑣的任務,例如寫作、翻譯、搜索等。這些任務往往耗時費力,讓人感到疲憊不堪。推薦最強的AI助理Monica、‎Gemini、Recraft圖片或ICON創作
Thumbnail
這是一篇有關塔羅占卜的文章,根據不同選項的占卜,提供了未來三個月的運勢預測。透過文章內容,人們可以瞭解到未來的運勢以及應對的方式。
Thumbnail
導讀:根據美國最新的一項研究發現,男人性慾在一定時間內會呈現有趣的規律,具體可以分為四類,即一生的、每年的、每個月的和每天的。美國某性研究所建議,性生活不和諧的夫妻可以利 根據美國最新的一項研究發現,男人性慾在一定時間內會呈現有趣的規律,具體可以分為四類,即一生的、每年的、
Thumbnail
確定 ChatGPT 還是 Claude AI 更好取決於具體的用例和要求。每個人工智慧工具都有其優點和局限性。以下是一個比較,可幫助評估哪一個更適合您的需求: ChatGPT 1.更擅長創意寫作任務和生成富有想像力的內容。 2.在編碼問題、結果解釋和一般輸出格式方面具有強大的能力。
Thumbnail
SDXL 0.9是stable diffusion新推出的一個繪圖模型,宣稱效果更好,且其訓練基礎由傳統的512x512提升到1024x1024,所以繪製大圖時效果較佳,且據某些網站表示,SDXL 0.9的假想敵會是Midjourney。 這裡介紹兩個可以簡單快速試用SDXL 0.9的網站。
Thumbnail
這篇文章將會比較 OpenAI ChatGPT、Microsoft Bing 以及 Google Bard 三個聊天 AI,我將會以我最真實的使用感受來比較三者,希望可以幫助到看這篇文章的你。
Thumbnail
做貴金屬投資要想勝率高,免不了分析市場,除了根據基本面資訊判斷行情大勢之外,還可以利用行情分析軟體來掌握市場細節變化。但不同軟體有不同使用體驗,哪個貴金屬行情分析軟體更好呢?必須強力推薦幾乎完美符合了所有投資者的需求MT4軟體!
Thumbnail
無論投資者進行哪種理財,最重要的還是要有一個的優質平台,不然若連基本的投資環境都難以得到保證,後續交易想要增加收益也極為困難。作為潛在收益率高且規則靈活的貴金屬投資,哪個貴金屬交易平台好呢?投資者若不知如何挑選,可以使用排除法,以不選哪些平台來反向找到優質平台。 哪個貴金屬交易平台好?避開陷阱找到好
Thumbnail
有時候,我們會因為一些因素,而讓自己稍微不像自己那麼一點。 說真的,那份改變,有時候是為了讓我們能更好? 還是,變得讓自己開始厭惡自己呢? 當遇到了言語爭吵,無論是主動方還是被動那一方,只要有過都會影響:每個人面對的方式都不同,而這面對的期間,所發生的事情,也會改變你的個性,而那些改變是你願意的,還
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
在這個資訊爆炸的時代,我們每天都會接觸到大量的資訊。然而,要從中找到我們真正需要的信息,卻並非易事。此外,我們的工作和生活中也常常需要進行一些繁瑣的任務,例如寫作、翻譯、搜索等。這些任務往往耗時費力,讓人感到疲憊不堪。推薦最強的AI助理Monica、‎Gemini、Recraft圖片或ICON創作
Thumbnail
這是一篇有關塔羅占卜的文章,根據不同選項的占卜,提供了未來三個月的運勢預測。透過文章內容,人們可以瞭解到未來的運勢以及應對的方式。
Thumbnail
導讀:根據美國最新的一項研究發現,男人性慾在一定時間內會呈現有趣的規律,具體可以分為四類,即一生的、每年的、每個月的和每天的。美國某性研究所建議,性生活不和諧的夫妻可以利 根據美國最新的一項研究發現,男人性慾在一定時間內會呈現有趣的規律,具體可以分為四類,即一生的、每年的、
Thumbnail
確定 ChatGPT 還是 Claude AI 更好取決於具體的用例和要求。每個人工智慧工具都有其優點和局限性。以下是一個比較,可幫助評估哪一個更適合您的需求: ChatGPT 1.更擅長創意寫作任務和生成富有想像力的內容。 2.在編碼問題、結果解釋和一般輸出格式方面具有強大的能力。
Thumbnail
SDXL 0.9是stable diffusion新推出的一個繪圖模型,宣稱效果更好,且其訓練基礎由傳統的512x512提升到1024x1024,所以繪製大圖時效果較佳,且據某些網站表示,SDXL 0.9的假想敵會是Midjourney。 這裡介紹兩個可以簡單快速試用SDXL 0.9的網站。
Thumbnail
這篇文章將會比較 OpenAI ChatGPT、Microsoft Bing 以及 Google Bard 三個聊天 AI,我將會以我最真實的使用感受來比較三者,希望可以幫助到看這篇文章的你。
Thumbnail
做貴金屬投資要想勝率高,免不了分析市場,除了根據基本面資訊判斷行情大勢之外,還可以利用行情分析軟體來掌握市場細節變化。但不同軟體有不同使用體驗,哪個貴金屬行情分析軟體更好呢?必須強力推薦幾乎完美符合了所有投資者的需求MT4軟體!
Thumbnail
無論投資者進行哪種理財,最重要的還是要有一個的優質平台,不然若連基本的投資環境都難以得到保證,後續交易想要增加收益也極為困難。作為潛在收益率高且規則靈活的貴金屬投資,哪個貴金屬交易平台好呢?投資者若不知如何挑選,可以使用排除法,以不選哪些平台來反向找到優質平台。 哪個貴金屬交易平台好?避開陷阱找到好
Thumbnail
有時候,我們會因為一些因素,而讓自己稍微不像自己那麼一點。 說真的,那份改變,有時候是為了讓我們能更好? 還是,變得讓自己開始厭惡自己呢? 當遇到了言語爭吵,無論是主動方還是被動那一方,只要有過都會影響:每個人面對的方式都不同,而這面對的期間,所發生的事情,也會改變你的個性,而那些改變是你願意的,還