AI繪圖-繪圖步數(steps)越高會越好嗎?(以真人版鏈鋸人瑪奇瑪為例)

更新於 2023/04/21閱讀時間約 5 分鐘

前言:

以下測試同樣都是使用stable diffusion webui。
1.據我之前看過的網路文章或網路討論,大多是指繪圖步數越高則繪圖細節會越多,但其正面效益會隨著步數的持續增加而遞減。但我並沒有看到有人明確的描述細節的提昇到底是提昇在哪?可以提昇多少?效益的遞減又是怎麼遞減的?我只好自己測一次才會甘願了。
2.上次的鏈鋸人瑪奇瑪畫的太醜,我這次決心重畫一次。
3.我還是不知道到底要叫真紀真還是叫瑪奇瑪。
以下是我的測試內容,我簡單的列出圖片並講解我觀察到的現象就好。本來我的測法是10步一個階段,後來發現這樣產出的圖太多太雜,外加每10步一階段可能看不出變化,最後改成每20步一階段,最後測到120步確實是太誇張,這只是為了能夠產出6張圖讓我貼圖時比較對稱而已。

1.步數高並不保證圖片就會更漂亮或更正確

提升步數造成的結果仍充滿隨機性,不一定步數多就會畫的正確或漂亮,例如下圖是以DPM++SDE Karras為採樣方式,本來畫的算是正確,但在60步與100步時眼睛反而變的略醜略歪。
眼睛在100步時反而變醜了

2.繪圖結果不一定會受步數影響,也有可能毫無變化。

雖說大部份的情況下,步數的變化通常會影響到繪圖內容,不論是變好還是變壞,但這不是絕對的,下圖是以UniPC為採樣方式,到60步以後的圖就基本不變了,甚至到了100步/120步時的產出已經是連細節都完全一致了。

3.畫面變大不代表細節就一定可以變多

這是上一個項目的延伸題,在第二項測試中,我們觀察到UniPC到60步以後就不太變化了,我猜測是否因為畫面太小造成它的變化空間有限?所以我把畫面尺寸調大後再試一次(由600x800調整為1024x768)。
但很明顯的,畫面變大之後並沒有什麼改變,這次一樣是60步以後的圖就不太有變化了,而80步以後的三張圖連細節都完全一致。大圖片可以呈現的內容確實更多更豐富,但那是跟畫面尺寸有關,跟步數的增加沒什麼關係。

4.LMS/DPM fast/PLMS這三種採樣方式所需要的基本步數比別種採樣方式高,就是這樣而已

這個項目是為了我自己的妄想而測的,從我之前的測試中可知LMS/DPM fast/PLMS這三種採樣方式在20~30步時是一定畫不好圖的,它必須有較高的基本步數,那我就懷疑它只是單純的比較沒力,還是它有藏招?也許在高步數時才能體現出它的威力?
顯然,它真的只是沒力而已,這三種都要在40~50步左右才能出圖,但步數繼續升高並沒有表現出什麼驚艷之處。以下貼出其中兩種採樣方式的圖做為代表就好。
LMS的結果:
DPM fast的結果:

5.細節就算真的有增加,也未必是加在你想要的地方

下圖以Euler a為例,這邊是一個典型的好例子,隨著步數增加,每次的圖片內容都有變化,而且都沒畫歪。但問題是它的細節也許是真的有隨著繪圖步數增加,但都加在沒意義的地方。我們一般會期望細節可以加在重點部份,例如以下方人物圖來說就是會希望它能夠增加更多的人物細節/皮膚紋路/光影效果等等,結果它全在折騰那片背景,它就是把A招牌改成B招牌,或是把C建築改成D建築這樣改來改去不知所謂。

6.適可而止就好

下圖同樣以Euler a為例,這同樣是一個典型的好例子,步數的增加都有確實造成圖片的變化,而且細節確實是有提昇。
縮圖也許不明顯,我直接抓出20步與120步的頭部來做對比:可以很明顯的看出20步時臉部像開了美顏,也缺乏光影效果,120步時就看的出皮膚紋路與光影效果了,髮部細節也增加許多。
20步
120步
但為了追求這樣的效果就故意設成120步其實不是個划算的選擇,如果只是想要有更多的皮膚紋路與光影效果,40~60步之間就有達成不錯的成果了,步數再往後增加的效益已是肉眼難辨,繪圖時間與繪圖效果不成正比,沒有CP值。
40步

7.想光靠步數增加細節不切實際

這步就不用上圖了,這是上面所有圖片的觀察總結,從上面的圖片可以發現,步數的增加也許能夠對圖片造成一些正向變化,但這些變化是微小且不可控的,最終的繪圖成品差異都不算太大,甚至還有幾個越弄越糟的例子。
因此若真想精心打造一張高細節的複雜圖片,從別的地方下手也許效益更明顯,例如修改prompt或是引入一些圖片美化的外掛等等。再嫌不足可以用inpant等方式慢慢去刻,反正都會比一直狂加步數實在。
我個人的想法是也許步數設成20~30左右就夠了,若覺得不足就直接從其它地方去做改善比較實際,圖片主體在20~30步就算完成了,之後增加更多的步數意義已經不大,可能僅是微小的錦上添花,甚至是畫蛇添足。

8.動漫風格也測一下

這邊沒什麼話要說,只是想看看動漫風格的效果而已

總結:

  • 步數高並不保證圖片就會更漂亮或更正確
  • 繪圖結果不一定會受步數影響,也有可能毫無變化。
  • 畫面變大不代表細節就一定可以變多
  • LMS/DPM fast/PLMS沒有藏招,它們真的只是單純的低步數就畫不出圖
  • 細節就算真的有增加,也未必是加在你想要的地方
  • 步數的增加適可而止就好
  • 想光靠步數增加細節不切實際
即將進入廣告,捲動後可繼續閱讀
為什麼會看到廣告
avatar-img
276會員
90內容數
沙龍自介: 雜文派,舉凡AI介紹、科技新知、廢談網誌、小說動漫通通都寫。雖說如此,但目前以AI與科技類文章為主軸,我也不知道怎麼變這樣的,holy 媽祖。 本人不喜歡看長篇文章,也不擅長寫長篇文章,我的意思是:我的優點是廢話很少,看我一篇文不會花你太多時間。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
因人廢言 的其他內容
這個測試沿用上次的鏈鋸人測試方式,差別只是角色換成了明日香而已,這次用的Lora易用度較高,真人風格與動漫風格的輸出都還算穩定。 真人風格的model使用Chilloutmix-Ni,動漫風格的model使用anything-v4.5,Lora來源為C站的明日香Lora。
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
以下講一些有關stable diffusion webui的幾個小操作,都不難,也都很實用,也許其實你早就知道了,這些都不是什麼驚奇的事,但我發現似乎並不是所有人都知道這些事。 這些真的都是一些雞毛蒜皮的小事,不足以獨立寫成一篇教學文章,所以我就簡單的匯整一下就好。
之前用20種採樣方式,隨機生成四張圖,好像沒什麼可比性,每一組的生成結果都差不多是有好有壞。如果畫四張不同的圖比不出好壞,那全部畫同一張圖的話呢?這次的測試就是針對這個疑問而進行的。
這篇主要是比較目前在stable diffusion webui下的20種採樣方式的圖片生成速度與生成結果比較。此處所說的採樣即是Sampling method,也有的會翻成取樣方法。
今天要講的這個同樣是Stable Diffusion web UI的插件:3D OpenPose Editor。 這個3D OpenPose Editor更好用,整合了更多東西並且同樣是3D視角,連手指控制的功能都被整合進來了。
這個測試沿用上次的鏈鋸人測試方式,差別只是角色換成了明日香而已,這次用的Lora易用度較高,真人風格與動漫風格的輸出都還算穩定。 真人風格的model使用Chilloutmix-Ni,動漫風格的model使用anything-v4.5,Lora來源為C站的明日香Lora。
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
以下講一些有關stable diffusion webui的幾個小操作,都不難,也都很實用,也許其實你早就知道了,這些都不是什麼驚奇的事,但我發現似乎並不是所有人都知道這些事。 這些真的都是一些雞毛蒜皮的小事,不足以獨立寫成一篇教學文章,所以我就簡單的匯整一下就好。
之前用20種採樣方式,隨機生成四張圖,好像沒什麼可比性,每一組的生成結果都差不多是有好有壞。如果畫四張不同的圖比不出好壞,那全部畫同一張圖的話呢?這次的測試就是針對這個疑問而進行的。
這篇主要是比較目前在stable diffusion webui下的20種採樣方式的圖片生成速度與生成結果比較。此處所說的採樣即是Sampling method,也有的會翻成取樣方法。
今天要講的這個同樣是Stable Diffusion web UI的插件:3D OpenPose Editor。 這個3D OpenPose Editor更好用,整合了更多東西並且同樣是3D視角,連手指控制的功能都被整合進來了。
你可能也想看
Google News 追蹤
Thumbnail
本文探討了複利效應的重要性,並藉由巴菲特的投資理念,說明如何選擇穩定產生正報酬的資產及長期持有的核心理念。透過定期定額的投資方式,不僅能減少情緒影響,還能持續參與全球股市的發展。此外,文中介紹了使用國泰 Cube App 的便利性及低手續費,幫助投資者簡化投資流程,達成長期穩定增長的財務目標。
Thumbnail
用Canva「Text to image」製作出帥哥微崩圖,再用Unidream「圖生圖」上傳圖片並輸入文字指示,男生竟然變女生?!修改後,男生能變男生了,細部崩壞無法解決?!咱麼辦呢?「凡事轉個彎,跳脫框架,能創造意想不到的結果」。
Thumbnail
如果有設計師故意想要這樣的設計呢?他就不想要每扇窗長一樣,可以嗎?也可以啦~~~就是在視覺的感受不太好。
Thumbnail
中二病少女這次去了外星球,化身複製人大軍,身穿帝國的暴風兵裝備,這次一樣用realistic fantasy模型,再搭配其他的(你知道的專作瑟瑟圖的那種模型)試試看效果,去呈現荒涼外星球的戰鬥。但星際大戰的光劍始終都很怪很可笑,等下可以看。 這次表情沒下提示詞連笑都不笑,同伴倒下也呈現呆滯狀,表現的
Thumbnail
前幾天看到格友Vanessa Li 的手繪與AI繪畫|美圖秀秀軟體 這篇文章,為我開展了圖片編輯的新視野。 我拿了自己很喜歡的小葉秀妍照片來嘗試,發現由美圖秀秀AI繪畫功能創作出來的圖像真的很有趣。
Thumbnail
各種不同的構圖方式,以及不同特寫程度的角色畫面,再到畫面中人物呈現的數量差別。
Thumbnail
剛開始使用 MidJourney 的新手,需要了解如何輸入 Prompt (製圖指令)才能掌控繪圖品質。對於一個剛開始使用 MidJourney 的新手,應該如何學習呢?這篇文章會分享MidJourney 中你需要掌握 5 個重要製圖元素:關鍵字、圖片視角組成、燈光、參數、算圖模型。
Thumbnail
我簡單玩了一下Stable Diffusion 的網頁版,看了一下prompthero裡面的圖片,我對其他軟體的 AI 繪圖大概有一個印象了,我想詢問一下我的讀者希望專題怎麼運作。
Thumbnail
那關於我用完基礎配額這件事、兩手準備、Midjourney 優點、新舊專題介紹。
Thumbnail
本文探討了複利效應的重要性,並藉由巴菲特的投資理念,說明如何選擇穩定產生正報酬的資產及長期持有的核心理念。透過定期定額的投資方式,不僅能減少情緒影響,還能持續參與全球股市的發展。此外,文中介紹了使用國泰 Cube App 的便利性及低手續費,幫助投資者簡化投資流程,達成長期穩定增長的財務目標。
Thumbnail
用Canva「Text to image」製作出帥哥微崩圖,再用Unidream「圖生圖」上傳圖片並輸入文字指示,男生竟然變女生?!修改後,男生能變男生了,細部崩壞無法解決?!咱麼辦呢?「凡事轉個彎,跳脫框架,能創造意想不到的結果」。
Thumbnail
如果有設計師故意想要這樣的設計呢?他就不想要每扇窗長一樣,可以嗎?也可以啦~~~就是在視覺的感受不太好。
Thumbnail
中二病少女這次去了外星球,化身複製人大軍,身穿帝國的暴風兵裝備,這次一樣用realistic fantasy模型,再搭配其他的(你知道的專作瑟瑟圖的那種模型)試試看效果,去呈現荒涼外星球的戰鬥。但星際大戰的光劍始終都很怪很可笑,等下可以看。 這次表情沒下提示詞連笑都不笑,同伴倒下也呈現呆滯狀,表現的
Thumbnail
前幾天看到格友Vanessa Li 的手繪與AI繪畫|美圖秀秀軟體 這篇文章,為我開展了圖片編輯的新視野。 我拿了自己很喜歡的小葉秀妍照片來嘗試,發現由美圖秀秀AI繪畫功能創作出來的圖像真的很有趣。
Thumbnail
各種不同的構圖方式,以及不同特寫程度的角色畫面,再到畫面中人物呈現的數量差別。
Thumbnail
剛開始使用 MidJourney 的新手,需要了解如何輸入 Prompt (製圖指令)才能掌控繪圖品質。對於一個剛開始使用 MidJourney 的新手,應該如何學習呢?這篇文章會分享MidJourney 中你需要掌握 5 個重要製圖元素:關鍵字、圖片視角組成、燈光、參數、算圖模型。
Thumbnail
我簡單玩了一下Stable Diffusion 的網頁版,看了一下prompthero裡面的圖片,我對其他軟體的 AI 繪圖大概有一個印象了,我想詢問一下我的讀者希望專題怎麼運作。
Thumbnail
那關於我用完基礎配額這件事、兩手準備、Midjourney 優點、新舊專題介紹。