AI繪圖-繪圖步數(steps)越高會越好嗎?(以真人版鏈鋸人瑪奇瑪為例)

更新於 發佈於 閱讀時間約 5 分鐘

前言:

以下測試同樣都是使用stable diffusion webui。
1.據我之前看過的網路文章或網路討論,大多是指繪圖步數越高則繪圖細節會越多,但其正面效益會隨著步數的持續增加而遞減。但我並沒有看到有人明確的描述細節的提昇到底是提昇在哪?可以提昇多少?效益的遞減又是怎麼遞減的?我只好自己測一次才會甘願了。
2.上次的鏈鋸人瑪奇瑪畫的太醜,我這次決心重畫一次。
3.我還是不知道到底要叫真紀真還是叫瑪奇瑪。
以下是我的測試內容,我簡單的列出圖片並講解我觀察到的現象就好。本來我的測法是10步一個階段,後來發現這樣產出的圖太多太雜,外加每10步一階段可能看不出變化,最後改成每20步一階段,最後測到120步確實是太誇張,這只是為了能夠產出6張圖讓我貼圖時比較對稱而已。

1.步數高並不保證圖片就會更漂亮或更正確

提升步數造成的結果仍充滿隨機性,不一定步數多就會畫的正確或漂亮,例如下圖是以DPM++SDE Karras為採樣方式,本來畫的算是正確,但在60步與100步時眼睛反而變的略醜略歪。
眼睛在100步時反而變醜了

2.繪圖結果不一定會受步數影響,也有可能毫無變化。

雖說大部份的情況下,步數的變化通常會影響到繪圖內容,不論是變好還是變壞,但這不是絕對的,下圖是以UniPC為採樣方式,到60步以後的圖就基本不變了,甚至到了100步/120步時的產出已經是連細節都完全一致了。

3.畫面變大不代表細節就一定可以變多

這是上一個項目的延伸題,在第二項測試中,我們觀察到UniPC到60步以後就不太變化了,我猜測是否因為畫面太小造成它的變化空間有限?所以我把畫面尺寸調大後再試一次(由600x800調整為1024x768)。
但很明顯的,畫面變大之後並沒有什麼改變,這次一樣是60步以後的圖就不太有變化了,而80步以後的三張圖連細節都完全一致。大圖片可以呈現的內容確實更多更豐富,但那是跟畫面尺寸有關,跟步數的增加沒什麼關係。

4.LMS/DPM fast/PLMS這三種採樣方式所需要的基本步數比別種採樣方式高,就是這樣而已

這個項目是為了我自己的妄想而測的,從我之前的測試中可知LMS/DPM fast/PLMS這三種採樣方式在20~30步時是一定畫不好圖的,它必須有較高的基本步數,那我就懷疑它只是單純的比較沒力,還是它有藏招?也許在高步數時才能體現出它的威力?
顯然,它真的只是沒力而已,這三種都要在40~50步左右才能出圖,但步數繼續升高並沒有表現出什麼驚艷之處。以下貼出其中兩種採樣方式的圖做為代表就好。
LMS的結果:
DPM fast的結果:

5.細節就算真的有增加,也未必是加在你想要的地方

下圖以Euler a為例,這邊是一個典型的好例子,隨著步數增加,每次的圖片內容都有變化,而且都沒畫歪。但問題是它的細節也許是真的有隨著繪圖步數增加,但都加在沒意義的地方。我們一般會期望細節可以加在重點部份,例如以下方人物圖來說就是會希望它能夠增加更多的人物細節/皮膚紋路/光影效果等等,結果它全在折騰那片背景,它就是把A招牌改成B招牌,或是把C建築改成D建築這樣改來改去不知所謂。

6.適可而止就好

下圖同樣以Euler a為例,這同樣是一個典型的好例子,步數的增加都有確實造成圖片的變化,而且細節確實是有提昇。
縮圖也許不明顯,我直接抓出20步與120步的頭部來做對比:可以很明顯的看出20步時臉部像開了美顏,也缺乏光影效果,120步時就看的出皮膚紋路與光影效果了,髮部細節也增加許多。
20步
120步
但為了追求這樣的效果就故意設成120步其實不是個划算的選擇,如果只是想要有更多的皮膚紋路與光影效果,40~60步之間就有達成不錯的成果了,步數再往後增加的效益已是肉眼難辨,繪圖時間與繪圖效果不成正比,沒有CP值。
40步

7.想光靠步數增加細節不切實際

這步就不用上圖了,這是上面所有圖片的觀察總結,從上面的圖片可以發現,步數的增加也許能夠對圖片造成一些正向變化,但這些變化是微小且不可控的,最終的繪圖成品差異都不算太大,甚至還有幾個越弄越糟的例子。
因此若真想精心打造一張高細節的複雜圖片,從別的地方下手也許效益更明顯,例如修改prompt或是引入一些圖片美化的外掛等等。再嫌不足可以用inpant等方式慢慢去刻,反正都會比一直狂加步數實在。
我個人的想法是也許步數設成20~30左右就夠了,若覺得不足就直接從其它地方去做改善比較實際,圖片主體在20~30步就算完成了,之後增加更多的步數意義已經不大,可能僅是微小的錦上添花,甚至是畫蛇添足。

8.動漫風格也測一下

這邊沒什麼話要說,只是想看看動漫風格的效果而已

總結:

  • 步數高並不保證圖片就會更漂亮或更正確
  • 繪圖結果不一定會受步數影響,也有可能毫無變化。
  • 畫面變大不代表細節就一定可以變多
  • LMS/DPM fast/PLMS沒有藏招,它們真的只是單純的低步數就畫不出圖
  • 細節就算真的有增加,也未必是加在你想要的地方
  • 步數的增加適可而止就好
  • 想光靠步數增加細節不切實際
即將進入廣告,捲動後可繼續閱讀
為什麼會看到廣告
avatar-img
276會員
90內容數
沙龍自介: 雜文派,舉凡AI介紹、科技新知、廢談網誌、小說動漫通通都寫。雖說如此,但目前以AI與科技類文章為主軸,我也不知道怎麼變這樣的,holy 媽祖。 本人不喜歡看長篇文章,也不擅長寫長篇文章,我的意思是:我的優點是廢話很少,看我一篇文不會花你太多時間。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
因人廢言 的其他內容
這個測試沿用上次的鏈鋸人測試方式,差別只是角色換成了明日香而已,這次用的Lora易用度較高,真人風格與動漫風格的輸出都還算穩定。 真人風格的model使用Chilloutmix-Ni,動漫風格的model使用anything-v4.5,Lora來源為C站的明日香Lora。
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
以下講一些有關stable diffusion webui的幾個小操作,都不難,也都很實用,也許其實你早就知道了,這些都不是什麼驚奇的事,但我發現似乎並不是所有人都知道這些事。 這些真的都是一些雞毛蒜皮的小事,不足以獨立寫成一篇教學文章,所以我就簡單的匯整一下就好。
之前用20種採樣方式,隨機生成四張圖,好像沒什麼可比性,每一組的生成結果都差不多是有好有壞。如果畫四張不同的圖比不出好壞,那全部畫同一張圖的話呢?這次的測試就是針對這個疑問而進行的。
這篇主要是比較目前在stable diffusion webui下的20種採樣方式的圖片生成速度與生成結果比較。此處所說的採樣即是Sampling method,也有的會翻成取樣方法。
今天要講的這個同樣是Stable Diffusion web UI的插件:3D OpenPose Editor。 這個3D OpenPose Editor更好用,整合了更多東西並且同樣是3D視角,連手指控制的功能都被整合進來了。
這個測試沿用上次的鏈鋸人測試方式,差別只是角色換成了明日香而已,這次用的Lora易用度較高,真人風格與動漫風格的輸出都還算穩定。 真人風格的model使用Chilloutmix-Ni,動漫風格的model使用anything-v4.5,Lora來源為C站的明日香Lora。
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
以下講一些有關stable diffusion webui的幾個小操作,都不難,也都很實用,也許其實你早就知道了,這些都不是什麼驚奇的事,但我發現似乎並不是所有人都知道這些事。 這些真的都是一些雞毛蒜皮的小事,不足以獨立寫成一篇教學文章,所以我就簡單的匯整一下就好。
之前用20種採樣方式,隨機生成四張圖,好像沒什麼可比性,每一組的生成結果都差不多是有好有壞。如果畫四張不同的圖比不出好壞,那全部畫同一張圖的話呢?這次的測試就是針對這個疑問而進行的。
這篇主要是比較目前在stable diffusion webui下的20種採樣方式的圖片生成速度與生成結果比較。此處所說的採樣即是Sampling method,也有的會翻成取樣方法。
今天要講的這個同樣是Stable Diffusion web UI的插件:3D OpenPose Editor。 這個3D OpenPose Editor更好用,整合了更多東西並且同樣是3D視角,連手指控制的功能都被整合進來了。
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
自從AI繪圖成效可以上檯面以來,各種聲浪不斷出現,在此也藉由這一張插畫說說個人主觀的看法。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
對筆者而言,這就是基於現實比小說更荒誕的情況下,會使用的轉換工具。本計算程式是基於已知當下的馬達繞線條件,包括漆包線徑及圈數後,計算出導體面積,之後在依照設計需求改換不同線徑時,可自動計算出圈數的變化;或是變動馬達設計圈數時,計算獲取新的漆包線徑值。由此可知,本工具是在固定槽滿率的條件之下,進行漆包
Thumbnail
本文是針對馬達繞線時,想要依本身的生產能力調整漆包線徑粗度時,會使用到的轉換計算進行介紹及說明。 實際量產時往往將多條細線並繞的馬達,改由單條粗線採用機台繞線,較為省時;但開發階段,並無設備協助,僅能採用人工繞線打樣時,則會調整為多條細線並聯的模式才能順利工作,這類不同情境下的線徑變化,三不五時就
Thumbnail
前期先針對整體流程模仿 可以快速理解一個主題如何拆解成不同的要素 快速取得一個學習的利基點 一個好的方式就是以完成專案為目的下去學習 為何要做Project Based的學習,而非一步一步完成課程? 因為直接做專案可以最快的碰到問題,知道自己還缺少哪方面的認知 人類無法用抽象的事物把事情
瞭解梯度下降算法中的學習速率調整,包括為什麼需要動態的學習速率、Root Mean Square、RMSProp、最常用的optimization策略Adam,以及如何進行Learning rate Scheduling。
Thumbnail
生命靈數連線中,有一條與學習能力有關。不但學習速度快,還能遊刃有餘的變出新花招、玩創意...。在科技推動快速變化的現在,這條靈數連線能力請這樣用。。。
Thumbnail
在之前的文章中已經有提到細線併繞將會導致槽滿率的下降,本文就來深究其原因。 追根究柢就是因為多線併繞時,往往會於繞線的過程中,自然而然的產生類絞線排列,反倒使原本理想中的細線排列分佈,絞成了一個大圓線的配置,導致更多的間隙使得馬達槽滿率下降。 在線徑與並聯股數換算中有一個計算例,是4股的0.3m
Thumbnail
本文來探討細線對於馬達特性的影響。 其實身為一位馬達設計者,腦中應該就不會有細線的選項,這點可以由最基本的馬達轉矩公式就可一窺其原因;其中跟馬達漆包線圈有直接關聯的參數僅有圈數(N),這代表圈數越多,則轉矩就越大。而另一個間接會影響到的參數為電流(I),主要是歐姆定律告知我們,在固定輸入電壓(V)
Thumbnail
其實修圖不會100%無破綻,因為把圖放到最大是呈現上圖那樣,有很多的馬賽克,連我們以為的黑色線條,它週邊其實還有一些淡淡的顏色,而真正的修圖高手其實是一點一點去點那些的格子,那樣子的成果才會細緻且漂亮。
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
自從AI繪圖成效可以上檯面以來,各種聲浪不斷出現,在此也藉由這一張插畫說說個人主觀的看法。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
對筆者而言,這就是基於現實比小說更荒誕的情況下,會使用的轉換工具。本計算程式是基於已知當下的馬達繞線條件,包括漆包線徑及圈數後,計算出導體面積,之後在依照設計需求改換不同線徑時,可自動計算出圈數的變化;或是變動馬達設計圈數時,計算獲取新的漆包線徑值。由此可知,本工具是在固定槽滿率的條件之下,進行漆包
Thumbnail
本文是針對馬達繞線時,想要依本身的生產能力調整漆包線徑粗度時,會使用到的轉換計算進行介紹及說明。 實際量產時往往將多條細線並繞的馬達,改由單條粗線採用機台繞線,較為省時;但開發階段,並無設備協助,僅能採用人工繞線打樣時,則會調整為多條細線並聯的模式才能順利工作,這類不同情境下的線徑變化,三不五時就
Thumbnail
前期先針對整體流程模仿 可以快速理解一個主題如何拆解成不同的要素 快速取得一個學習的利基點 一個好的方式就是以完成專案為目的下去學習 為何要做Project Based的學習,而非一步一步完成課程? 因為直接做專案可以最快的碰到問題,知道自己還缺少哪方面的認知 人類無法用抽象的事物把事情
瞭解梯度下降算法中的學習速率調整,包括為什麼需要動態的學習速率、Root Mean Square、RMSProp、最常用的optimization策略Adam,以及如何進行Learning rate Scheduling。
Thumbnail
生命靈數連線中,有一條與學習能力有關。不但學習速度快,還能遊刃有餘的變出新花招、玩創意...。在科技推動快速變化的現在,這條靈數連線能力請這樣用。。。
Thumbnail
在之前的文章中已經有提到細線併繞將會導致槽滿率的下降,本文就來深究其原因。 追根究柢就是因為多線併繞時,往往會於繞線的過程中,自然而然的產生類絞線排列,反倒使原本理想中的細線排列分佈,絞成了一個大圓線的配置,導致更多的間隙使得馬達槽滿率下降。 在線徑與並聯股數換算中有一個計算例,是4股的0.3m
Thumbnail
本文來探討細線對於馬達特性的影響。 其實身為一位馬達設計者,腦中應該就不會有細線的選項,這點可以由最基本的馬達轉矩公式就可一窺其原因;其中跟馬達漆包線圈有直接關聯的參數僅有圈數(N),這代表圈數越多,則轉矩就越大。而另一個間接會影響到的參數為電流(I),主要是歐姆定律告知我們,在固定輸入電壓(V)
Thumbnail
其實修圖不會100%無破綻,因為把圖放到最大是呈現上圖那樣,有很多的馬賽克,連我們以為的黑色線條,它週邊其實還有一些淡淡的顏色,而真正的修圖高手其實是一點一點去點那些的格子,那樣子的成果才會細緻且漂亮。