從零開始學AI繪圖 - 談 Stable Diffusion的Prompt (咒語)

從零開始學AI繪圖 - 談 Stable Diffusion的Prompt (咒語)

更新於 發佈於 閱讀時間約 8 分鐘
AI繪圖就像使用咒語一樣

AI繪圖就像使用咒語一樣

AI繪圖當道,我們時常在網路上看到令人驚豔的AI繪圖成品,但是就是不知道厲害的網友們怎麼生成這樣的AI繪圖成品的。也有很多人戲稱AI繪圖就是要懂得詠唱咒語,的確,對於不知道怎麼使用AI繪圖工具,或是第一次接觸AI繪圖工具的人,直接來使用類似Stable Diffusion這樣的進階工具,確實是比較有門檻。我推薦你先看看我介紹繪圖工具的這一篇,先從"玩"開始起步,有興趣了,再來跟我們一起研究比較進階的AI繪圖工具。

今天這一篇,我們要從實測的角度開始來學習怎麼掌握Stable Diffusion的咒語(Prompt),我們會一步一步從最基本的Prompt開始,慢慢的把細節加上去,拆解Prompt裡面的元素,並且實測每個步驟的圖片給大家看,這樣大家在調製自己的風格的時候也能更清楚Prompt裡面的元素,才不會總是直接copy別人的整篇咒語但是又不知道內容是什麼。

要了解咒語,我們就先從咒語的四大元素開始講起。以下是我整理給各位的圖表

4 Key Point of AI Painting Prompt

4 Key Point of AI Painting Prompt

主體是我們一切Prompt的基礎,如果沒有正確的形容一個主體,那麼就無法得到好的結果,在這邊的範例,我們一樣用合作的痔瘡醫師鍾雲霓作為範本(所以會套上我們training的LORA這邊就不特別列出來)。假設我們今天想要畫一個用火焰的魔法師,初學者可能就會很直接地打上"A sorceress",得到以下的圖片

A sorceress

A sorceress

但是這樣顯然對於主體的描述來說是不夠的,人物雖然因為我用了很漂亮的base model所以還說得過去,但是姿態各有不同,而且看起來好像沒有特別像是魔法師? 請問對於主體的人物來說該有什麼姿態呢? 魔法師要操作怎樣的魔法? 應該穿怎樣的衣服? 如果不描述清楚,就會產生這樣每一張都不太一樣的照片,而且AI想像的魔法師可能跟你想像的不一樣。如果我們進一步把這些細節加入主體的描述之中,就可以發現產出會比較一致,譬如說我們希望這是火魔法師的全身照,而且要穿著魔法袍,那麼以下為調整過的Prompt "full body portrait of a powerful sorceress wearing magical robe, casting fire magic" 那麼就會得到一致的多的結果如下(為了讓臉部不要壞掉,我有勾選Hires. fix 並且把圖片變成兩倍大,這樣可以有效改善小圖片的時候臉部崩壞的狀況)

full body portrait of a powerful sorceress wearing magical robe, casting fire magic

full body portrait of a powerful sorceress wearing magical robe, casting fire magic

接下來要談的第二個要素就是媒介Medium,究竟你希望你產出來的圖片是 油畫呢? 照片呢? 水彩畫呢? 還是電子畫作? 這些都應該要寫在Prompt裡面,我直接產圖給各位看例子,油畫/水彩畫/照片風格/線條風格,各自有所不同。Prompt: oil painting, full body portrait of a powerful sorceress wearing magical robe, casting fire magic

Same prompt, different medium

Same prompt, different medium

第三個我們要談的要素就是風格,其實這跟第二個媒介也是有點類似,但是你可以請Stable Diffusion 模仿各類畫家的風格,出來的結果當然會有蠻大的差別,但是這跟你使用的Base Model也有很大的關係,以下為我請AI模仿幾個名畫家的結果,可以看到用畫家的名字來改變風格,是最強大的改變風格作法。Prompt: Art by (Vincent van Gogh或是其他以下畫家), full body portrait of a powerful sorceress wearing magical robe, casting fire magic

Same prompt, different artist

Same prompt, different artist

風格這邊當然也指光影跟整體的色彩,同樣的Prompt如果給了不同的色彩跟光影,就會有不同的結果。以下為更改色彩的Prompt 把最後的顏色改掉就可以

full body portrait of a powerful sorceress wearing magical robe, casting fire magic, round face, (iridescent gold themed或black and white 或silvery blue或vibrant green)

Same prompt, different color

Same prompt, different color

最後一個部分就是細節,在這邊我們可以加入很多跟細節相關的字眼來提升品質,常用的就是類似 masterpiece, best quality, intricate detail, highly detail, 4k 等等的字眼,我在這一篇文章裏面有提到可以提升整體的細節程度。另外一個細節就是我們不妨加入很多跟人物的背景,身上的小道具等等有關的東西,這些都會被Stable diffusion 列入考慮一起畫出來,舉例來說我們希望這個女魔法師是在圖書館的環境裡面施展火魔法,所以就加入很多場景的細節, 考慮到以上的所有技巧,我們把所有的要素合併在一個prompt裡面就會有類似以下的很長的咒語。8k, (masterpiece), (best quality), full body portrait of a powerful sorceress wearing ornate magic robe, (casting fire magic), round face, mysterious expression, flowing robes, amulet, ancient library, parchment scrolls, dusty tomes, wooden bookshelves, ink and quill, celestial globes, astrological charts, magic circle, sparks of fire, golden bracelets, ruby rings, intricate detail, (silvery blue themed)
產出來的圖片則大概是下面這樣:

8k, (masterpiece), (best quality), full body portrait of a powerful sorceress wearing ornate magic robe, (casting fire magic), round face, mysterious expression, flowing robes, amulet, ancient library, parchment scrolls, dusty tomes, wooden bookshelves, ink and quill, celestial globes, astrological charts, magic circle, sparks of fire, golden bracelets, ruby rings, intricate detail, (silvery blue themed)

8k, (masterpiece), (best quality), full body portrait of a powerful sorceress wearing ornate magic robe, (casting fire magic), round face, mysterious expression, flowing robes, amulet, ancient library, parchment scrolls, dusty tomes, wooden bookshelves, ink and quill, celestial globes, astrological charts, magic circle, sparks of fire, golden bracelets, ruby rings, intricate detail, (silvery blue themed)

大家覺得怎樣呢? 搞懂了Prompt的組成以後,是否現在看就覺得沒有這麼神秘了? 歡迎大家多多交流並且分享自己的產出,也提醒大家記得去看這一篇我探討如何關於圖片品質的幾個要素。














avatar-img
技術PM路易斯的沙龍
49會員
35內容數
技術PM的AI實驗室,是以輕鬆的角度深入簡出的探討各種生成式AI工具的使用。無論你是想理解AI到底是怎麼運作的? 想知道有那些好用的生成式AI工具? 或者是對AI繪圖有興趣的,都歡迎加入我們的AI實驗室一起輕鬆地玩耍,我們邊玩邊學,學習跟AI一起共創新的可能。
留言
avatar-img
留言分享你的想法!
在這篇示範裡面,我將教你如何利用AI繪圖工具Stable Diffusion產生出自己的一整套塔羅牌排組,而且這整套牌組還是套用上自己Training的LORA的,也就是塔羅牌的主角都可以是你或是你身邊的人(或是你的偶像明星),一旦掌握訣竅,用這篇的方法一天以內就可以完成這個工作。
我們今天這一篇文章,要分享我自己玩AI繪圖到目前為止的心得並且把影響AI繪圖品質歸類為四大要素,我將以實證並且實測的角度來驗證給各位看,到底這幾個要素會怎樣影響我們產生的AI繪圖的品質,跟我一樣好奇或者是AI的繪圖新手們應該可以從今天的文章中掌握到如何提升圖片品質的技巧。
今天我這邊提供大家一個方法,讓大家可以自己成為這些AI繪圖的主角,也就是在AI裡面建立屬於你自己個人的模型。Stable Diffusion比較少這部分的教學,是因為這部分的訓練的確比較有一些技術的門檻,我這邊會嘗試用比較簡單的方式讓大家可以一個步驟一個步驟照著做,就能夠達到我們想要達到的結果。
我們介紹過很多AI繪圖工具,但是究竟哪一個AI繪圖工具最能理解你的描述呢? 我們決定直接拿一模一樣的輸入(Prompt)餵給各種工具,讓我們來看看會得到怎樣的結果,就知道哪個AI工具最能聽懂人話,請看這篇的分析與實測。
對於還完全沒有AI繪圖經驗的你,該怎麼開始呢? 很簡單,就是開始”玩”! 先從動手開始隨便玩,讓想像力帶著你到處跑,在今天這篇文章裡面我會把幾個比較熱門的AI繪圖網站/工具介紹給你,你可以不要有任何心理壓力的開始玩玩看,看看能得到什麼有趣的結果。
這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,講解各個各位聽聽AI繪圖的箇中道理。
在這篇示範裡面,我將教你如何利用AI繪圖工具Stable Diffusion產生出自己的一整套塔羅牌排組,而且這整套牌組還是套用上自己Training的LORA的,也就是塔羅牌的主角都可以是你或是你身邊的人(或是你的偶像明星),一旦掌握訣竅,用這篇的方法一天以內就可以完成這個工作。
我們今天這一篇文章,要分享我自己玩AI繪圖到目前為止的心得並且把影響AI繪圖品質歸類為四大要素,我將以實證並且實測的角度來驗證給各位看,到底這幾個要素會怎樣影響我們產生的AI繪圖的品質,跟我一樣好奇或者是AI的繪圖新手們應該可以從今天的文章中掌握到如何提升圖片品質的技巧。
今天我這邊提供大家一個方法,讓大家可以自己成為這些AI繪圖的主角,也就是在AI裡面建立屬於你自己個人的模型。Stable Diffusion比較少這部分的教學,是因為這部分的訓練的確比較有一些技術的門檻,我這邊會嘗試用比較簡單的方式讓大家可以一個步驟一個步驟照著做,就能夠達到我們想要達到的結果。
我們介紹過很多AI繪圖工具,但是究竟哪一個AI繪圖工具最能理解你的描述呢? 我們決定直接拿一模一樣的輸入(Prompt)餵給各種工具,讓我們來看看會得到怎樣的結果,就知道哪個AI工具最能聽懂人話,請看這篇的分析與實測。
對於還完全沒有AI繪圖經驗的你,該怎麼開始呢? 很簡單,就是開始”玩”! 先從動手開始隨便玩,讓想像力帶著你到處跑,在今天這篇文章裡面我會把幾個比較熱門的AI繪圖網站/工具介紹給你,你可以不要有任何心理壓力的開始玩玩看,看看能得到什麼有趣的結果。
這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,講解各個各位聽聽AI繪圖的箇中道理。