哪個AI繪圖工具最能聽懂人話?

2023/05/16閱讀時間約 4 分鐘

Whisper to your AI - by Midjourney

我在這篇文章之中介紹了幾個好用的繪圖工具，其實AI繪圖工具最吸引人的部分就是 "他能聽懂你的話，並且把你的話轉換成實際的圖片" ，這真的是一個非常神奇的過程，跟過去我們還要自己拿起滑鼠跟繪圖板相比，這實在是一個魔法時刻。

但是究竟AI工具是不是真的能聽得懂我們的人話呢? 還是其實只能拆解裡面的單字理解一部分而已呢? 我們今天就來做個簡單的測試，直接拿一模一樣的輸入(Prompt)餵給各種工具，讓我們來看看會得到怎樣的結果，就知道哪個AI工具最能聽懂人話囉! 既然要做測試，那我們就來選擇一個不能太單純的 Prompt，有不只一個主詞(多個主體)，然後也有動作，也包含環境跟敘述的Prompt。

我們今天選的是an artistic painting of a pretty girl standing underwater embracing 2 big fishes. 主詞有 A pretty girl 跟 2 big fishes, 動作是Embrace，環境是Underwater，繪畫的生成形勢是Artistic Painting。

第一個選手的就是我們的元老Dall-E，以下是產出來的結果

其實產出來的結果是讓我覺得吃驚的好，因為主詞完全正確，動作也完全正確，繪畫形式還有環境也很正確，但是Dall-E的弱點就是繪圖的細節跟美感不OK，人物的結構不算是太OK。

第二個選手是從Dall-E改變而來的Bing Image Creator，以下是結果

產出來的結果可以說是相當得不錯，主體(女孩跟兩隻魚)非常正確，動作上有一點問題，並沒有真正的Embrace (不過有另外幾張圖其實有做到這樣的動作只是相對構圖比較差)，環境跟繪畫的形式也都完全正確，畫面的細節比Dall-E好多了。

第三個選手是插畫家最愛的Midjourney，以下為測試結果

好的，產出來結果在美感上真是無懈可擊，且在繪畫的形式還有環境上也呈現的非常完美，但是主體是一個女孩跟一堆魚? 而且說好的擁抱呢? 我重複嘗試了好幾次，雖然偶爾可以有正確的擁抱姿勢，但是永遠都會產出魚群來。

最後一個選手是我們之前談過的，最需要控制的Stable Diffusion，為了避免呈現完全沒有控制的Stable Diffusion 的圖片太醜，這次我用了比較美觀的Model加上一些修試圖片品質的Prompt，但是核心敘述是完全相同的，得到了以下的結果。

SD產出來的圖片只要經過正確的Prompt engineering跟參數選擇，充滿美感是沒問題的，但是主體跟Midjourney一樣弄不清楚”兩隻魚"的概念，而且Embrace這個動作呈現得更糟糕了，哪裡生出來的魚叉?

最後隱藏選手，這是2023/5/5才發表的DeepFloyd.Ai 採用的是Google 的Imagen模型，跟前面的選手都不同，最強的地方是終於可以生成正確的文字了，我把Prompt 偷偷加上了Pisces(雙魚座)這個文字，產出如下的圖片

可以看到對於文字的理解程度非常好，而且我希望他打出來的字完全正確! 不過這個畫質跟美感，應該還有很長一段路要走，總之是非常令人期待的，等到將來比較成熟以後，我也會把它列為正式的選手來做各種比較。

最後來總結一下，哪個工具最能聽懂人話呢? 依照我們的測試結果，Dall-E跟Bing Image Creator 是最佳的選擇，畢竟背後的Transformer model是由OpenAI(ChatGPT發明者)提供的，所以比較能理解你說的話看來不是隨便說說的，考量到美感問題應該Bing Image Creator是首選，再來的話可以考慮Midjourney，其實多測試修改幾次Prompt 應該都可以得到你想要的結果，無論要商用或是要寫文章配圖用，都還是非常實用的，而且完全不需要擔心美感。最後的話就是我們的Stable Diffusion了，老實說能聽懂人話的部分不多，如果複雜的圖片(有包含多種人物跟複雜動作的圖片)要得到好的結果，就必須要去學習一些進階的技巧才能達到效果。以上，是今天簡短的分享，很希望大家也有學到一點東西，歡迎各位給我一些回饋囉!

為什麼會看到廣告

技術PM路易斯的沙龍技術PM的AI實驗室AI繪圖技術PM路易斯的沙龍技術PM的AI實驗室AI深度學習

技術PM路易斯的沙龍

49會員

35內容數

技術PM的AI實驗室，是以輕鬆的角度深入簡出的探討各種生成式AI工具的使用。無論你是想理解AI到底是怎麼運作的? 想知道有那些好用的生成式AI工具? 或者是對AI繪圖有興趣的，都歡迎加入我們的AI實驗室一起輕鬆地玩耍，我們邊玩邊學，學習跟AI一起共創新的可能。

留言0

查看全部

發表第一個留言支持創作者！

技術PM路易斯的沙龍的其他內容

如何讓ChatGPT產出更精確的答案 — 淺談Prompt Engineering (二)

上次我們在這篇裡面提到了如何讓ChatGPT產出更為精確的答案，實際上就是透過三大原則加上一個小提示，本偏要補充一些很實用的方式，可以讓各位即使是比較複雜的任務，也可以讓ChatGPT替你完成。

#ChatGPT #AI #DeepLearning

如何讓ChatGPT產出更精確的答案 — 淺談Prompt Engineering (一)

在AI的術語之中，給AI的輸入問題叫做Prompt，而問出對AI來說好的問題，或是給AI精確的指示這門技術就叫做Prompt Engineering ，這跟寫程式一樣，是需要靠學習以及練習的。我們來淺談一下這個Prompt Engineering的基本，也就是怎麼問出好的問題。

#ChatGPT #學習 #AI

淺談AI繪圖工具 — 好用的幾個AI繪圖工具介紹與比較

對於還完全沒有AI繪圖經驗的你，該怎麼開始呢? 很簡單，就是開始”玩”! 先從動手開始隨便玩，讓想像力帶著你到處跑，在今天這篇文章裡面我會把幾個比較熱門的AI繪圖網站/工具介紹給你，你可以不要有任何心理壓力的開始玩玩看，看看能得到什麼有趣的結果。

#AI繪圖 #OpenAI #繪圖

為什麼ChatGPT數學不好? 淺談人工智慧與演算法的差別

AI人工智慧跟一般的演算法差別在哪邊呢? 本篇就是要告訴你為什麼無所不能ChatGPT，上知天文下知地理，可是就是有一個很明顯的弱點，請他算數學卻很常算錯，明明這個ChatGPT 充滿想像力，請他寫演講稿，草擬策略都很在行，為什麼數學就是不行呢?

#AI人工智慧 #ChatGPT #人工智慧

AI 像人類一樣學習嗎 — 淺談AI繪圖生成的原理

這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的，究竟只會簡簡單單運算數字的電腦，只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理，而是用我理解這件事情的方法，講解各個各位聽聽AI繪圖的箇中道理。

#AI繪圖 #學習 #DeepLearning

AI的工具這麼多，我到底該學什麼?

到底該學習什麼AI的工具呢? 有一次在PODCAST上偶爾然聽到有人分享，該如何有系統的利用3W1H來解決問題，也談到了關於AI工具之類的想法，所以我這邊稍微做了點整理，作為我這邊探討AI工具的開端。

#AI繪圖 #學習 #AI

第二部分：美國總統大選看未來四年的佈局板塊與投資邏輯（下篇：會員獨享）

接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議分析兩位候選人政策利多/ 利空的板塊和股票

#美國大選 #美國總統選舉 #美股投資

矽谷jojo的沙龍

2024/10/27

[獵人]冨樫如何合理化妮翁的死亡？

🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢？ 🤨作者巧思-讓妮翁死亡合理的幾個伏筆

#HUNTER×HUNTER #全職獵人

小資女の職場生存之道

2024/05/07

【AI軟體評比】Gemini、Recraft、Monica，哪一個最適合你？

在這個資訊爆炸的時代，我們每天都會接觸到大量的資訊。然而，要從中找到我們真正需要的信息，卻並非易事。此外，我們的工作和生活中也常常需要進行一些繁瑣的任務，例如寫作、翻譯、搜索等。這些任務往往耗時費力，讓人感到疲憊不堪。推薦最強的AI助理Monica、‎Gemini、Recraft圖片或ICON創作

#機器人選擇 #應有盡有的AI功能 #簡單好上手的快捷鍵

塔羅Lab.研究生在幹嘛?

2024/05/04

接下來3個月的哪方面會有好運?[AI生成圖塔羅占卜]

這是一篇有關塔羅占卜的文章，根據不同選項的占卜，提供了未來三個月的運勢預測。透過文章內容，人們可以瞭解到未來的運勢以及應對的方式。

#運氣 #好運 #運勢

猛男誕生記

2024/04/19

哪個時間你會成為性能力最強的人

導讀:根據美國最新的一項研究發現，男人性慾在一定時間內會呈現有趣的規律，具體可以分為四類，即一生的、每年的、每個月的和每天的。美國某性研究所建議，性生活不和諧的夫妻可以利根據美國最新的一項研究發現，男人性慾在一定時間內會呈現有趣的規律，具體可以分為四類，即一生的、每年的、

#男性 #男人 #研究所

男子漢聊AI的沙龍

2023/10/17

ChatGPT和Claude AI使用哪一個更好？它倆的區別是？

確定 ChatGPT 還是 Claude AI 更好取決於具體的用例和要求。每個人工智慧工具都有其優點和局限性。以下是一個比較，可幫助評估哪一個更適合您的需求： ChatGPT 1.更擅長創意寫作任務和生成富有想像力的內容。 2.在編碼問題、結果解釋和一般輸出格式方面具有強大的能力。

#AI工具推薦

因人廢言

2023/07/20

AI繪圖-兩個可以快速試用SDXL 0.9的繪圖網站，SDXL 0.9是否真的比較強?哪個繪圖網站比較好?

SDXL 0.9是stable diffusion新推出的一個繪圖模型，宣稱效果更好，且其訓練基礎由傳統的512x512提升到1024x1024，所以繪製大圖時效果較佳，且據某些網站表示，SDXL 0.9的假想敵會是Midjourney。這裡介紹兩個可以簡單快速試用SDXL 0.9的網站。

#SDXL #SD #leonardo

穿越異世界

2023/04/09

ChatGPT、Bing、Google Bard 哪一個是好用的AI工具？

這篇文章將會比較 OpenAI ChatGPT、Microsoft Bing 以及 Google Bard 三個聊天 AI，我將會以我最真實的使用感受來比較三者，希望可以幫助到看這篇文章的你。

#ChatGPT #OpenAI #Bing

貴金屬學院的沙龍

2022/01/21

哪個貴金屬行情分析軟體更好？認準MT4！

做貴金屬投資要想勝率高，免不了分析市場，除了根據基本面資訊判斷行情大勢之外，還可以利用行情分析軟體來掌握市場細節變化。但不同軟體有不同使用體驗，哪個貴金屬行情分析軟體更好呢？必須強力推薦幾乎完美符合了所有投資者的需求MT4軟體！

#貴金屬行情分析軟體 #貴金屬行情分析 #貴金屬投資軟體

貴金屬學院的沙龍

2021/11/29

哪個貴金屬交易平台好？避開陷阱找到好平台！

無論投資者進行哪種理財，最重要的還是要有一個的優質平台，不然若連基本的投資環境都難以得到保證，後續交易想要增加收益也極為困難。作為潛在收益率高且規則靈活的貴金屬投資，哪個貴金屬交易平台好呢？投資者若不知如何挑選，可以使用排除法，以不選哪些平台來反向找到優質平台。哪個貴金屬交易平台好？避開陷阱找到好

#哪個貴金屬交易平台好 #貴金屬交易平台 #貴金屬交易平臺

詩言詩語的沙龍

2021/08/25

哪個「你」，是真的「你」？

有時候，我們會因為一些因素，而讓自己稍微不像自己那麼一點。說真的，那份改變，有時候是為了讓我們能更好？還是，變得讓自己開始厭惡自己呢？當遇到了言語爭吵，無論是主動方還是被動那一方，只要有過都會影響：每個人面對的方式都不同，而這面對的期間，所發生的事情，也會改變你的個性，而那些改變是你願意的，還

#心靈成長 #身心靈覺察 #心靈雞湯

MimiVsJames的美股投資分享

2024/10/26

第二部分：美國總統大選看未來四年的佈局板塊與投資邏輯（下篇：會員獨享）

接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議分析兩位候選人政策利多/ 利空的板塊和股票

#美國大選 #美國總統選舉 #美股投資

矽谷jojo的沙龍

2024/10/27

[獵人]冨樫如何合理化妮翁的死亡？

🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢？ 🤨作者巧思-讓妮翁死亡合理的幾個伏筆

#HUNTER×HUNTER #全職獵人

小資女の職場生存之道

2024/05/07

【AI軟體評比】Gemini、Recraft、Monica，哪一個最適合你？

#機器人選擇 #應有盡有的AI功能 #簡單好上手的快捷鍵

塔羅Lab.研究生在幹嘛?

2024/05/04

接下來3個月的哪方面會有好運?[AI生成圖塔羅占卜]

這是一篇有關塔羅占卜的文章，根據不同選項的占卜，提供了未來三個月的運勢預測。透過文章內容，人們可以瞭解到未來的運勢以及應對的方式。

#運氣 #好運 #運勢

猛男誕生記

2024/04/19

哪個時間你會成為性能力最強的人

#男性 #男人 #研究所

男子漢聊AI的沙龍

2023/10/17

ChatGPT和Claude AI使用哪一個更好？它倆的區別是？

#AI工具推薦

因人廢言

2023/07/20

AI繪圖-兩個可以快速試用SDXL 0.9的繪圖網站，SDXL 0.9是否真的比較強?哪個繪圖網站比較好?

#SDXL #SD #leonardo

穿越異世界

2023/04/09

ChatGPT、Bing、Google Bard 哪一個是好用的AI工具？

這篇文章將會比較 OpenAI ChatGPT、Microsoft Bing 以及 Google Bard 三個聊天 AI，我將會以我最真實的使用感受來比較三者，希望可以幫助到看這篇文章的你。

#ChatGPT #OpenAI #Bing

貴金屬學院的沙龍

2022/01/21

哪個貴金屬行情分析軟體更好？認準MT4！

#貴金屬行情分析軟體 #貴金屬行情分析 #貴金屬投資軟體

貴金屬學院的沙龍

2021/11/29

哪個貴金屬交易平台好？避開陷阱找到好平台！

#哪個貴金屬交易平台好 #貴金屬交易平台 #貴金屬交易平臺

詩言詩語的沙龍

2021/08/25

哪個「你」，是真的「你」？

#心靈成長 #身心靈覺察 #心靈雞湯

哪個AI繪圖工具最能聽懂人話?

如何讓ChatGPT產出更精確的答案 — 淺談Prompt Engineering (二)

如何讓ChatGPT產出更精確的答案 — 淺談Prompt Engineering (一)

淺談AI繪圖工具 — 好用的幾個AI繪圖工具介紹與比較

為什麼ChatGPT數學不好? 淺談人工智慧與演算法的差別

AI 像人類一樣學習嗎 — 淺談AI繪圖生成的原理

AI的工具這麼多，我到底該學什麼?

如何讓ChatGPT產出更精確的答案 — 淺談Prompt Engineering (二)

如何讓ChatGPT產出更精確的答案 — 淺談Prompt Engineering (一)

淺談AI繪圖工具 — 好用的幾個AI繪圖工具介紹與比較

為什麼ChatGPT數學不好? 淺談人工智慧與演算法的差別

AI 像人類一樣學習嗎 — 淺談AI繪圖生成的原理

AI的工具這麼多，我到底該學什麼?

你可能也想看

第二部分：美國總統大選看未來四年的佈局板塊與投資邏輯（下篇：會員獨享）

[獵人]冨樫如何合理化妮翁的死亡？

【AI軟體評比】Gemini、Recraft、Monica，哪一個最適合你？

接下來3個月的哪方面會有好運?[AI生成圖 塔羅占卜]

哪個時間你會成為性能力最強的人

ChatGPT和Claude AI使用哪一個更好？它倆的區別是？

AI繪圖-兩個可以快速試用SDXL 0.9的繪圖網站，SDXL 0.9是否真的比較強?哪個繪圖網站比較好?

ChatGPT、Bing、Google Bard 哪一個是好用的AI工具？

哪個貴金屬行情分析軟體更好？認準MT4！

哪個貴金屬交易平台好？避開陷阱找到好平台！

哪個「你」，是真的「你」？

第二部分：美國總統大選看未來四年的佈局板塊與投資邏輯（下篇：會員獨享）

[獵人]冨樫如何合理化妮翁的死亡？

【AI軟體評比】Gemini、Recraft、Monica，哪一個最適合你？

接下來3個月的哪方面會有好運?[AI生成圖 塔羅占卜]

哪個時間你會成為性能力最強的人

ChatGPT和Claude AI使用哪一個更好？它倆的區別是？

AI繪圖-兩個可以快速試用SDXL 0.9的繪圖網站，SDXL 0.9是否真的比較強?哪個繪圖網站比較好?

ChatGPT、Bing、Google Bard 哪一個是好用的AI工具？

哪個貴金屬行情分析軟體更好？認準MT4！

哪個貴金屬交易平台好？避開陷阱找到好平台！

哪個「你」，是真的「你」？

接下來3個月的哪方面會有好運?[AI生成圖塔羅占卜]

接下來3個月的哪方面會有好運?[AI生成圖塔羅占卜]