AI繪圖-繪圖步數(steps)越高會越好嗎?(以真人版鏈鋸人瑪奇瑪為例)

更新於 發佈於 閱讀時間約 6 分鐘

前言:

以下測試同樣都是使用stable diffusion webui。

1.據我之前看過的網路文章或網路討論,大多是指繪圖步數越高則繪圖細節會越多,但其正面效益會隨著步數的持續增加而遞減。但我並沒有看到有人明確的描述細節的提昇到底是提昇在哪?可以提昇多少?效益的遞減又是怎麼遞減的?我只好自己測一次才會甘願了。
2.上次的鏈鋸人瑪奇瑪畫的太醜,我這次決心重畫一次。
3.我還是不知道到底要叫真紀真還是叫瑪奇瑪。

以下是我的測試內容,我簡單的列出圖片並講解我觀察到的現象就好。本來我的測法是10步一個階段,後來發現這樣產出的圖太多太雜,外加每10步一階段可能看不出變化,最後改成每20步一階段,最後測到120步確實是太誇張,這只是為了能夠產出6張圖讓我貼圖時比較對稱而已。

1.步數高並不保證圖片就會更漂亮或更正確

提升步數造成的結果仍充滿隨機性,不一定步數多就會畫的正確或漂亮,例如下圖是以DPM++SDE Karras為採樣方式,本來畫的算是正確,但在60步與100步時眼睛反而變的略醜略歪。

raw-image
raw-image
眼睛在100步時反而變醜了

眼睛在100步時反而變醜了


2.繪圖結果不一定會受步數影響,也有可能毫無變化。

雖說大部份的情況下,步數的變化通常會影響到繪圖內容,不論是變好還是變壞,但這不是絕對的,下圖是以UniPC為採樣方式,到60步以後的圖就基本不變了,甚至到了100步/120步時的產出已經是連細節都完全一致了。

raw-image
raw-image

3.畫面變大不代表細節就一定可以變多

這是上一個項目的延伸題,在第二項測試中,我們觀察到UniPC到60步以後就不太變化了,我猜測是否因為畫面太小造成它的變化空間有限?所以我把畫面尺寸調大後再試一次(由600x800調整為1024x768)。

但很明顯的,畫面變大之後並沒有什麼改變,這次一樣是60步以後的圖就不太有變化了,而80步以後的三張圖連細節都完全一致。大圖片可以呈現的內容確實更多更豐富,但那是跟畫面尺寸有關,跟步數的增加沒什麼關係。

raw-image
raw-image

4.LMS/DPM fast/PLMS這三種採樣方式所需要的基本步數比別種採樣方式高,就是這樣而已

這個項目是為了我自己的妄想而測的,從我之前的測試中可知LMS/DPM fast/PLMS這三種採樣方式在20~30步時是一定畫不好圖的,它必須有較高的基本步數,那我就懷疑它只是單純的比較沒力,還是它有藏招?也許在高步數時才能體現出它的威力?

顯然,它真的只是沒力而已,這三種都要在40~50步左右才能出圖,但步數繼續升高並沒有表現出什麼驚艷之處。以下貼出其中兩種採樣方式的圖做為代表就好。

LMS的結果:

raw-image
raw-image

DPM fast的結果:

raw-image
raw-image

5.細節就算真的有增加,也未必是加在你想要的地方

下圖以Euler a為例,這邊是一個典型的好例子,隨著步數增加,每次的圖片內容都有變化,而且都沒畫歪。但問題是它的細節也許是真的有隨著繪圖步數增加,但都加在沒意義的地方。我們一般會期望細節可以加在重點部份,例如以下方人物圖來說就是會希望它能夠增加更多的人物細節/皮膚紋路/光影效果等等,結果它全在折騰那片背景,它就是把A招牌改成B招牌,或是把C建築改成D建築這樣改來改去不知所謂。

raw-image
raw-image

6.適可而止就好

下圖同樣以Euler a為例,這同樣是一個典型的好例子,步數的增加都有確實造成圖片的變化,而且細節確實是有提昇。

raw-image
raw-image

縮圖也許不明顯,我直接抓出20步與120步的頭部來做對比:可以很明顯的看出20步時臉部像開了美顏,也缺乏光影效果,120步時就看的出皮膚紋路與光影效果了,髮部細節也增加許多。

20步

20步

120步

120步

但為了追求這樣的效果就故意設成120步其實不是個划算的選擇,如果只是想要有更多的皮膚紋路與光影效果,40~60步之間就有達成不錯的成果了,步數再往後增加的效益已是肉眼難辨,繪圖時間與繪圖效果不成正比,沒有CP值。

40步

40步

7.想光靠步數增加細節不切實際

這步就不用上圖了,這是上面所有圖片的觀察總結,從上面的圖片可以發現,步數的增加也許能夠對圖片造成一些正向變化,但這些變化是微小且不可控的,最終的繪圖成品差異都不算太大,甚至還有幾個越弄越糟的例子。

因此若真想精心打造一張高細節的複雜圖片,從別的地方下手也許效益更明顯,例如修改prompt或是引入一些圖片美化的外掛等等。再嫌不足可以用inpant等方式慢慢去刻,反正都會比一直狂加步數實在。

我個人的想法是也許步數設成20~30左右就夠了,若覺得不足就直接從其它地方去做改善比較實際,圖片主體在20~30步就算完成了,之後增加更多的步數意義已經不大,可能僅是微小的錦上添花,甚至是畫蛇添足。

8.動漫風格也測一下

這邊沒什麼話要說,只是想看看動漫風格的效果而已

raw-image
raw-image


總結:

  • 步數高並不保證圖片就會更漂亮或更正確
  • 繪圖結果不一定會受步數影響,也有可能毫無變化。
  • 畫面變大不代表細節就一定可以變多
  • LMS/DPM fast/PLMS沒有藏招,它們真的只是單純的低步數就畫不出圖
  • 細節就算真的有增加,也未必是加在你想要的地方
  • 步數的增加適可而止就好
  • 想光靠步數增加細節不切實際
留言
avatar-img
留言分享你的想法!
子不語-avatar-img
2023/04/20
試試看用Highres. Fix,這樣就會跑完圖之後用Upscaler來AI放大圖,這樣細節就會隨著圖放大而增加。
tim-avatar-img
2023/05/20
每个sampling methods 都有各自適合的步數。另外,有些sampling methods 是不收斂的,意思是步數越多,圖片不一定會趨向相同的結果。具體可以參考這篇文章:https://stable-diffusion-art.com/samplers/
avatar-img
因人廢言
281會員
91內容數
沙龍自介: 雜文派,舉凡AI介紹、科技新知、廢談網誌、小說動漫通通都寫。雖說如此,但目前以AI與科技類文章為主軸,我也不知道怎麼變這樣的,holy 媽祖。 本人不喜歡看長篇文章,也不擅長寫長篇文章,我的意思是:我的優點是廢話很少,看我一篇文不會花你太多時間。
因人廢言的其他內容
2024/03/19
簡介stable diffusion外掛之一的SadTalker。它能將靜態圖像配合聲音檔轉成對嘴動畫。 同時附上使用範例,惡搞了黃國昌甩蔥歌與川普。
Thumbnail
2024/03/19
簡介stable diffusion外掛之一的SadTalker。它能將靜態圖像配合聲音檔轉成對嘴動畫。 同時附上使用範例,惡搞了黃國昌甩蔥歌與川普。
Thumbnail
2024/02/20
本文介紹ReActor這套AI換臉軟體,它是stable diffusion外掛之一,可以視為deepFake與Lora的簡易替代品,易用好上手。 內容從基礎安裝開始講解,亦包含實際操作過程與圖片範例。 為免侵犯敏感人物的肖象權,內文以川普換與拜登做為例子。
Thumbnail
2024/02/20
本文介紹ReActor這套AI換臉軟體,它是stable diffusion外掛之一,可以視為deepFake與Lora的簡易替代品,易用好上手。 內容從基礎安裝開始講解,亦包含實際操作過程與圖片範例。 為免侵犯敏感人物的肖象權,內文以川普換與拜登做為例子。
Thumbnail
2024/01/26
2024年了,回顧一下我這整年寫過的文章,也回顧一下我用過的那些AI繪圖工具,2023真的是AI爆發的一年,如今AI工具已然滿大街都是,但這個專題我儘量還是本著初心,只介紹自己覺得有用的工具。 本文精選7個即使歷經一年的AI狂潮洗禮後我仍然覺得值得實用的AI繪圖工具。
Thumbnail
2024/01/26
2024年了,回顧一下我這整年寫過的文章,也回顧一下我用過的那些AI繪圖工具,2023真的是AI爆發的一年,如今AI工具已然滿大街都是,但這個專題我儘量還是本著初心,只介紹自己覺得有用的工具。 本文精選7個即使歷經一年的AI狂潮洗禮後我仍然覺得值得實用的AI繪圖工具。
Thumbnail
看更多
你可能也想看
Thumbnail
介紹朋友新開的蝦皮選物店『10樓2選物店』,並分享方格子與蝦皮合作的分潤計畫,註冊流程簡單,0成本、無綁約,推薦給想增加收入的讀者。
Thumbnail
介紹朋友新開的蝦皮選物店『10樓2選物店』,並分享方格子與蝦皮合作的分潤計畫,註冊流程簡單,0成本、無綁約,推薦給想增加收入的讀者。
Thumbnail
當你邊吃粽子邊看龍舟競賽直播的時候,可能會順道悼念一下2300多年前投江的屈原。但你知道端午節及其活動原先都與屈原毫無關係嗎?這是怎麼回事呢? 本文深入探討端午節設立初衷、粽子、龍舟競渡與屈原自沉四者。看完這篇文章,你就會對端午、粽子、龍舟和屈原的四角關係有新的認識喔。那就讓我們一起解開謎團吧!
Thumbnail
當你邊吃粽子邊看龍舟競賽直播的時候,可能會順道悼念一下2300多年前投江的屈原。但你知道端午節及其活動原先都與屈原毫無關係嗎?這是怎麼回事呢? 本文深入探討端午節設立初衷、粽子、龍舟競渡與屈原自沉四者。看完這篇文章,你就會對端午、粽子、龍舟和屈原的四角關係有新的認識喔。那就讓我們一起解開謎團吧!
Thumbnail
自從AI繪圖成效可以上檯面以來,各種聲浪不斷出現,在此也藉由這一張插畫說說個人主觀的看法。
Thumbnail
自從AI繪圖成效可以上檯面以來,各種聲浪不斷出現,在此也藉由這一張插畫說說個人主觀的看法。
Thumbnail
今天跟你分析視覺藝術化指令 "--s <數值>" 這部分 看看數值的不同,在產圖風格上會有什麼樣差異? "--s" 這個指令也可用 "--stylize" ,記得" "裡的內容才是指令! 它指藝術化風格的程度或視覺藝術化的程度,數值越高,會越接近 Midjourney 的AI預設,在v5
Thumbnail
今天跟你分析視覺藝術化指令 "--s <數值>" 這部分 看看數值的不同,在產圖風格上會有什麼樣差異? "--s" 這個指令也可用 "--stylize" ,記得" "裡的內容才是指令! 它指藝術化風格的程度或視覺藝術化的程度,數值越高,會越接近 Midjourney 的AI預設,在v5
Thumbnail
  已經玩SD好一陣子的人應該已經發現,很多名字帶有「Mix」且比較有名的checkpoint模型基本上就是在互相「抄來抄去」,而且在女角方面很多只使用了極少的人物重點訓練,導致算出來的臉常常「都長一個樣」。   那麼,該怎麼辦呢?
Thumbnail
  已經玩SD好一陣子的人應該已經發現,很多名字帶有「Mix」且比較有名的checkpoint模型基本上就是在互相「抄來抄去」,而且在女角方面很多只使用了極少的人物重點訓練,導致算出來的臉常常「都長一個樣」。   那麼,該怎麼辦呢?
Thumbnail
今天要講的是Midjourney的參數表(Parameter List),參數是可以添加到prompt中的選項,並用於更改圖像的生成方式。比如更改縱橫比(aspect Ratios)、切換模型版本(Model Versions)、更改使用的升級器等
Thumbnail
今天要講的是Midjourney的參數表(Parameter List),參數是可以添加到prompt中的選項,並用於更改圖像的生成方式。比如更改縱橫比(aspect Ratios)、切換模型版本(Model Versions)、更改使用的升級器等
Thumbnail
以下測試同樣都是使用stable diffusion webui。 據我之前看過的網路文章或網路討論,大多是指繪圖步數越高則繪圖細節會越多,但其正面效益會隨著步數的持續增加而遞減。但我並沒有看到有人明確的描述細節的提昇到底是提昇在哪?效益的遞減又是怎麼遞減的?我只好自己測一次才會甘願了。
Thumbnail
以下測試同樣都是使用stable diffusion webui。 據我之前看過的網路文章或網路討論,大多是指繪圖步數越高則繪圖細節會越多,但其正面效益會隨著步數的持續增加而遞減。但我並沒有看到有人明確的描述細節的提昇到底是提昇在哪?效益的遞減又是怎麼遞減的?我只好自己測一次才會甘願了。
Thumbnail
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
Thumbnail
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
Thumbnail
先說結論:   演算Img2Img時,Sampling Methods(取樣方法)中Karras類型比較忠於原圖,非Karras類型比較放飛自我。
Thumbnail
先說結論:   演算Img2Img時,Sampling Methods(取樣方法)中Karras類型比較忠於原圖,非Karras類型比較放飛自我。
Thumbnail
這篇文章主要講述運用 Drawio 繪製的幾何圖形,運用在 Midjourney 中進行繪製與召喚的方式,這篇文章內容可能包含恐怖谷與超現實圖片,請確定自己有一顆堅定的心在觀看。
Thumbnail
這篇文章主要講述運用 Drawio 繪製的幾何圖形,運用在 Midjourney 中進行繪製與召喚的方式,這篇文章內容可能包含恐怖谷與超現實圖片,請確定自己有一顆堅定的心在觀看。
Thumbnail
最近遊玩AI繪圖 尚不能操作國家級煉金術士等級的煉成陣 但讓AI重新繪製相似或是補齊缺失的細節是不難做到的 於是在下靈機一動,打開了N年以前的圖戰包 有的資源本身就是古早影視畫面的一小部分 有的則是網路上已經找不到原圖 除了金坷垃那種永不退流行的存在外 只剩下meme及文字的情緒渲染的圖片 逐漸因為
Thumbnail
最近遊玩AI繪圖 尚不能操作國家級煉金術士等級的煉成陣 但讓AI重新繪製相似或是補齊缺失的細節是不難做到的 於是在下靈機一動,打開了N年以前的圖戰包 有的資源本身就是古早影視畫面的一小部分 有的則是網路上已經找不到原圖 除了金坷垃那種永不退流行的存在外 只剩下meme及文字的情緒渲染的圖片 逐漸因為
Thumbnail
工作完成後回頭想想總覺得應該會有更聰明的方式才對,但在經費有限的情況下,似乎現階段利用這樣的多次版本逐步推進法已是相對在資源耗費與時間取捨平衡中的解決方案之一了。
Thumbnail
工作完成後回頭想想總覺得應該會有更聰明的方式才對,但在經費有限的情況下,似乎現階段利用這樣的多次版本逐步推進法已是相對在資源耗費與時間取捨平衡中的解決方案之一了。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News