從零開始學AI繪圖 - 實測AI繪圖品質的四大要素(Stable Diffusion)

閱讀時間約 7 分鐘
AI drawing pictures
各位AI繪圖的新手,在使用Stable Diffusion的時候,是否會讚嘆網路上的產品為何如此美麗? 為什麼我產出來的AI繪圖本身就是沒有辦法達到這樣的美感? 難道真的就是要學會那些秘密的咒語(Prompt)才能夠產生美圖嗎?
我們今天這一篇文章,要分享我自己玩AI繪圖到目前為止的心得並且把影響AI繪圖品質歸類為四大要素,我將以實證並且實測的角度來驗證給各位看,到底這幾個要素會怎樣影響我們產生的AI繪圖的品質,跟我一樣好奇或者是AI的繪圖新手們應該可以從今天的文章中掌握到如何提升圖片品質的技巧。關於Stable Diffusion的Prompt寫法,歡迎參考我這一篇文章裏面有比較詳細的說明。
底下就是我個人歸納AI繪圖影響繪圖品質的四大要素,雖然說是四大要素,但是其重要性其實是不太相等的,我這邊會一個一個詳細的解說。我會怎樣驗證這些要素呢? 很簡單,秉持著科學實驗的精神,一次改變一個變因,並且把實測的結果給各位看。
4 Key points for Stable Diffusion Output
第一個因素,Stable Diffusion 選用的Base Model也就是模型,所謂的模型也就是Stable Diffusion這個AI是被那些圖片訓練出來的。我們曾經在這篇文章中探討過AI是怎麼學習繪圖的,如果一個模型是被很多現實世界真正的照片所訓練,那麼他產生出來的圖片一定都是相當的擬真照片風格,如果一個模型是被非常多精美的圖片訓練過,那麼它產生出來的圖片也相對都會相當的美型(但是也很容易有特定的風格)。 我們就來實際看一下我們用同一組的Prompt 產出來的圖片,套用不同的Base Model的結果。 我想很多網友第一個都是希望可以產出美女圖,那麼我們從善如流就用以下的簡單Prompt來做測試吧。 "full body shot of a beautiful woman wearing futuristic outfit"並且加上適當的negative prompt我們 會得到以下的圖片
Sample prompt, different Models
可以看到,產生出來的是四種截然不同的結果。我選擇的第一個 Model Anything v4.5 會產生出非常有美感,但是完全是動漫風格的產出,而第二個我選擇的Model Chilloutmix 則是網路上很多美女圖選用的Base model會產出很漂亮但是面孔是東方年輕女性的,而第三個Dreamshaper model (個人最愛)則是會產出相對好看但是偏西方臉孔的圖片,而第四個大家覺得最沒有美感的反而是Stable Diffusion本身提供的基礎Model SD V1.5。所以產不出美圖嗎? 你第一個要做的事情就是選擇一個能夠產生出漂亮圖片的Base Model,這絕對是最重要的一點。
第二個因素也就是大家所說的詠唱咒語了,這就是Prompt,大家應該都覺得這是最重要的一點,實際上除了Base Model以外,確實也是最重要的,舉凡要產生的內容有哪些主體動作風格,都需要利用Prompt。而毫不意外的Prompt本身也會影響產出的圖片品質,這是怎麼做到的呢? 以下我們就統一用一樣的Base Model但是去嘗試有加上以及沒有加上品質相關的Prompt,還有搭配Negative Prompt去看結果如何。
Same model, differen prompt
這就是產出的結果,而且我有把Seed固定下來(固定Seed會讓我們每次都可以得到完全一樣的產出)。實測證明加上提升品質的Prompt真的可以有效提升產出的圖片品質,然後加上Negative prompt (反向咒語)如果運用得當,可以再次提升輸出的品質,但是也非常可能會大幅度的改變整個圖片的風格。由於詠唱咒語Prompt這個議題博大精深,我這邊肯定會在寫一些文章來深入討論並且實測。
第三個則是我們微調的參數,這部分在Stable Diffusion裡面有好多好多的參數可以調整如下圖
Stable Diffusion UI
初學者最容易理解的就是解析度(高跟寬),其他的可能就不是那麼容易理解了。Sampling method是取樣的方式,這個方式實測上其實發現會產出不同的圖案,但是跟"產出高品質圖案"沒有絕對的關係,比較多的是快慢的問題。比較相關的則是sampling step/CFG scale,我們直接實驗看看FF
CFG Scale vs sampling steps
看圖可以發現,CFG越高,會產生出來的紋理也就越多 (這可不見得是你想要的),一般大家會說CFG越高,會產生越多符合prompt敘述內容的圖片,但是我們這邊的實驗也會明確看到CFG設定越高,你的step 產圖的布數也要越多才行,否則反而會產出相當不美觀的半成品。以經驗法則來說,我個人喜歡使用Euler a, DPM++2M Karras, DPE++SDE Karras, 然後steps設定在25~30之間不要太高,可以得到比較好的感覺,設定太高有時候反而人物的皺紋跟線條都太多反而失去美感,這邊大家可以各自嘗試看看,找到自己最喜歡的參數。
第四個則是各種Extra Network,這包含了Textual Inversion,LORA還有Hypernetworks, 通常Textual inversion大家會用來做一些風格的調整還有反向咒語(Negative prompt)的調整,Hypernetwork也是有人使用但是以目前的成果來看效果相對不如Lora,所以最常使用的就是LORA了,在沒有深入探討之前,可以把這些Extra Network當成是Stable Diffusion的外掛,這些外掛可以影響生成的圖片的內容/風格,可以用來訓練成你喜歡的動漫的人物的樣子,或是訓練成你或是你家人的樣子,可以參考我的這一篇文章
底下就是同樣的Base model 同樣的Prompt套用了不同LORA的結果,大家可以看看差別。SS
sample prompt/model, different LORA
因為是同樣的Prompt/同樣的base model 但是因為套用了不同的LORA所以風格截然不同,且人物的衣服細節,背景等等也完全不同。善用LORA還可以幫助各位達到不需要加入太多細節在Prompt中,但是就可以得到很繁複的衣飾或是背景的效果,對於該怎麼去找LORA,該LORA產生出來的結果如何? 建議大家時常到CIVITAI.COM這個網站去看看,有非常多人無私地分享成果,在這邊也是我個人練功常去的地方,很推薦給各位。
以上,跟各位介紹了四個影響產出風格品質最多的要素,說到底,要AI繪圖時代要產出好的產品,除了有好的構想以外,一定要多多嘗試多多犯錯,歡迎大家也給我一些好的建議,我們互相交流,我們下次見囉。
為什麼會看到廣告
技術PM的AI實驗室,是以輕鬆的角度深入簡出的探討各種生成式AI工具的使用。無論你是想理解AI到底是怎麼運作的? 想知道有那些好用的生成式AI工具? 或者是對AI繪圖有興趣的,都歡迎加入我們的AI實驗室一起輕鬆地玩耍,我們邊玩邊學,學習跟AI一起共創新的可能。
留言0
查看全部
發表第一個留言支持創作者!
今天我這邊提供大家一個方法,讓大家可以自己成為這些AI繪圖的主角,也就是在AI裡面建立屬於你自己個人的模型。Stable Diffusion比較少這部分的教學,是因為這部分的訓練的確比較有一些技術的門檻,我這邊會嘗試用比較簡單的方式讓大家可以一個步驟一個步驟照著做,就能夠達到我們想要達到的結果。
我們介紹過很多AI繪圖工具,但是究竟哪一個AI繪圖工具最能理解你的描述呢? 我們決定直接拿一模一樣的輸入(Prompt)餵給各種工具,讓我們來看看會得到怎樣的結果,就知道哪個AI工具最能聽懂人話,請看這篇的分析與實測。
對於還完全沒有AI繪圖經驗的你,該怎麼開始呢? 很簡單,就是開始”玩”! 先從動手開始隨便玩,讓想像力帶著你到處跑,在今天這篇文章裡面我會把幾個比較熱門的AI繪圖網站/工具介紹給你,你可以不要有任何心理壓力的開始玩玩看,看看能得到什麼有趣的結果。
這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,講解各個各位聽聽AI繪圖的箇中道理。
到底該學習什麼AI的工具呢? 有一次在PODCAST上偶爾然聽到有人分享,該如何有系統的利用3W1H來解決問題,也談到了關於AI工具之類的想法,所以我這邊稍微做了點整理,作為我這邊探討AI工具的開端。
今天我這邊提供大家一個方法,讓大家可以自己成為這些AI繪圖的主角,也就是在AI裡面建立屬於你自己個人的模型。Stable Diffusion比較少這部分的教學,是因為這部分的訓練的確比較有一些技術的門檻,我這邊會嘗試用比較簡單的方式讓大家可以一個步驟一個步驟照著做,就能夠達到我們想要達到的結果。
我們介紹過很多AI繪圖工具,但是究竟哪一個AI繪圖工具最能理解你的描述呢? 我們決定直接拿一模一樣的輸入(Prompt)餵給各種工具,讓我們來看看會得到怎樣的結果,就知道哪個AI工具最能聽懂人話,請看這篇的分析與實測。
對於還完全沒有AI繪圖經驗的你,該怎麼開始呢? 很簡單,就是開始”玩”! 先從動手開始隨便玩,讓想像力帶著你到處跑,在今天這篇文章裡面我會把幾個比較熱門的AI繪圖網站/工具介紹給你,你可以不要有任何心理壓力的開始玩玩看,看看能得到什麼有趣的結果。
這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,講解各個各位聽聽AI繪圖的箇中道理。
到底該學習什麼AI的工具呢? 有一次在PODCAST上偶爾然聽到有人分享,該如何有系統的利用3W1H來解決問題,也談到了關於AI工具之類的想法,所以我這邊稍微做了點整理,作為我這邊探討AI工具的開端。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
本文主要介紹資產價值減損與投資性不動產的會計處理,文中輔以例題說明讓觀眾更容易理解相關概念。
Thumbnail
特別休假,我個人還是比較偏好、建議採週年制: 1.曆年制很可能產生遲延給假的狀況 2.曆年制需要計算日數,不像週年制固定日數 3.曆年制會產生畸零時數,公司請假單位可能無法配合 4.HR工作者需要具備解釋制度的能力,且勞工需要願意接受HR的解釋 5.曆年制最終(勞工離職時),還是要回歸週年制度驗算
Thumbnail
責任制其實是勞基法第84-1條的俗稱,而適用勞基法第84-1條並代表可以非無法無天,適用84-1條的工作者雖然可以在「一定範圍內」,對於工作時間、例假...等工時條件「另行約定」,但依然有相應的規範予以制衡,勞工依然有工時上限、加班費與例假的規範,而非坊間誤解的「沒有加班費」、「做完為止」。
Thumbnail
AI 相關的內容每天都非常多,有聽過很多人因此感覺到焦慮,怕錯過了最新資訊就會趕不上,這篇內容會跟大家詳細的分享我自己的學習方法和經驗,並且會在最後分享一些我的學習資訊來源。
Thumbnail
本片原文:五個月的日語奇蹟,從零開始的日語英雄:杜PC學友的秘密武器 https://vocus.cc/article/65403833fd897800010b0232
Thumbnail
本教學從 網路爬蟲 至 機器學習基礎 到 TensorFlow深度學習框架。 網路爬蟲 Beautiful Soup 安裝beautifulsoup4,用來分析html資料 安裝requests套件,將html資料抓回來顯示 lxml ,用於解析和編輯 XML 和 HTML 文檔 html5lib
Thumbnail
matplotlib Matplotlib 建新圖,基本步驟 Step 1 :Prepare Data Step 2 :Create Plot Step 3 :Plot Step 4 :Customize Plot Step 5 :Save Plot Step 6 :Show Plot f
我,AMOS,曾經走過不少彎路,所幸搭建了穩定的投資系統,給自己帶來了豐厚回報,這是一個簡介,希望大家繼續關注我,投資不迷路。
Thumbnail
更新日期:2021.12.13 作者:FAHAHA|翁順法 如果你是簡報初學者,不知道怎麼開始學起,這篇文章非常適合你先讀過,會幫助你掌握方向,並且省略很多摸索的時間。 我很喜歡一句話:學習(動詞)學習(名詞),再學習(動詞)。 先花心力學習如何學習,才是最有效的學習。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
本文主要介紹資產價值減損與投資性不動產的會計處理,文中輔以例題說明讓觀眾更容易理解相關概念。
Thumbnail
特別休假,我個人還是比較偏好、建議採週年制: 1.曆年制很可能產生遲延給假的狀況 2.曆年制需要計算日數,不像週年制固定日數 3.曆年制會產生畸零時數,公司請假單位可能無法配合 4.HR工作者需要具備解釋制度的能力,且勞工需要願意接受HR的解釋 5.曆年制最終(勞工離職時),還是要回歸週年制度驗算
Thumbnail
責任制其實是勞基法第84-1條的俗稱,而適用勞基法第84-1條並代表可以非無法無天,適用84-1條的工作者雖然可以在「一定範圍內」,對於工作時間、例假...等工時條件「另行約定」,但依然有相應的規範予以制衡,勞工依然有工時上限、加班費與例假的規範,而非坊間誤解的「沒有加班費」、「做完為止」。
Thumbnail
AI 相關的內容每天都非常多,有聽過很多人因此感覺到焦慮,怕錯過了最新資訊就會趕不上,這篇內容會跟大家詳細的分享我自己的學習方法和經驗,並且會在最後分享一些我的學習資訊來源。
Thumbnail
本片原文:五個月的日語奇蹟,從零開始的日語英雄:杜PC學友的秘密武器 https://vocus.cc/article/65403833fd897800010b0232
Thumbnail
本教學從 網路爬蟲 至 機器學習基礎 到 TensorFlow深度學習框架。 網路爬蟲 Beautiful Soup 安裝beautifulsoup4,用來分析html資料 安裝requests套件,將html資料抓回來顯示 lxml ,用於解析和編輯 XML 和 HTML 文檔 html5lib
Thumbnail
matplotlib Matplotlib 建新圖,基本步驟 Step 1 :Prepare Data Step 2 :Create Plot Step 3 :Plot Step 4 :Customize Plot Step 5 :Save Plot Step 6 :Show Plot f
我,AMOS,曾經走過不少彎路,所幸搭建了穩定的投資系統,給自己帶來了豐厚回報,這是一個簡介,希望大家繼續關注我,投資不迷路。
Thumbnail
更新日期:2021.12.13 作者:FAHAHA|翁順法 如果你是簡報初學者,不知道怎麼開始學起,這篇文章非常適合你先讀過,會幫助你掌握方向,並且省略很多摸索的時間。 我很喜歡一句話:學習(動詞)學習(名詞),再學習(動詞)。 先花心力學習如何學習,才是最有效的學習。