先說結論,提示詞位置互換,圖就不一樣!
最近在網上搜尋Stable Diffusion的提示詞用法時,發現一個意想不到的用法,SD官方提到過提示詞不僅可以使用權重來調整圖片的結果,甚至連不同的順序都會有不一樣的效果!至於效果差多少,有時候可以差很多。
我心血來潮測試了一下,將一個seed,負面提示詞,各種設定完全一樣的設定,只是將正面提示詞的詞位置調換,出來的成品大致相同,但是細節差很多!
第一組測試:
種子:1791102673
第一張正面提示詞:
an young beautiful Ukrainian woman with silver hair and black robe and dark cloak and wearing tiara, by agnes cecile, half body portrait, extremely luminous bright design, pastel colors, (ink:1.3), autumn lights, (8k, best quality, masterpiece:1.2),(best quality:1.0), (ultra highres:1.0), watercolor
第二張正面提示詞:
an young beautiful Ukrainian woman with silver hair and black robe and dark cloak and wearing tiara, by agnes cecile, autumn lights, (8k, best quality, masterpiece:1.2),(best quality:1.0), (ultra highres:1.0), watercolor, half body portrait, extremely luminous bright design, pastel colors, (ink:1.3)
因為這太驚人了,所以我決定一次產十張圖,並且把提示詞的輸入順序做個大幅度更換看看會出現什麼效果。
第二組測試:
種子不變
第一組正面提示詞:
sad, an young beautiful Ukrainian woman with silver hair, bluegray eyes, black robe and dark cloak, autumn lights, (8k, best quality, masterpiece:1.2),(best quality:1.0), (ultra highres:1.0), watercolor, half body portrait, extremely luminous bright design, pastel colors, (ink:1.3), by agnes cecile, 3d render
大部分的圖中,少女前臂穿著護臂,身處於維多利亞時代的煤氣燈都市
第二組正面提示詞:
sad, autumn lights, (8k, best quality, masterpiece:1.2),(best quality:1.0), (ultra highres:1.0), watercolor, half body portrait, extremely luminous bright design, pastel colors, (ink:1.3), by agnes cecile, 3d render, an young beautiful Ukrainian woman with silver hair, bluegray eyes, black robe and dark cloak
大部分的圖中,少女沒有穿護臂,身處於車水馬龍的現代都市
這兩組提示詞,第一組先描述對象。第二組先描述圖片光影屬性,結果出的圖,少女的臉幾乎一樣,但是服裝,背景跟時代感天差地遠!
會造成這個差別的原因,可能是因為Automatic1111把文字轉換成Token的時候,並不是一個Set,而是一個List,加上在推論時,所謂隨機挑選提示詞並不是真的隨機,而是依照給的種子來產生偽亂數。這樣的話提示詞位置的不同就會影響被挑中的文字,所以可能A組合會挑到維多利亞時代的倫敦街頭,但B組合會挑到現代都市(因為AB組合裡面都沒提到背景,所以是偽亂數決定)。
根據Stable Diffusion的操作手冊,在沒有特意把權重標示出來的情況下,越前面輸入的提示詞就越容易被選中。但是在我們輸入的提示詞其實是一樣的,不同的只是順序。但是在不同順序中,當它挑選我們沒有指定的提示詞時,會造成不同程度的影響!(是的,Stable Diffusion在去噪過程中會常常挑到我們沒有指定的提示詞,甚至會小機率挑到負面提示詞!)
結論:
也就是說,當你算到你心儀的圖片時,就可以靠重新排列正面、負面提示詞創造出許多臉蛋,表情大致相同(因為你已經用正面提示詞鎖定了),但是動作姿態、光影與環境都不一樣的圖!挑到同一角色,但場景與動作更棒的圖的機會就更大了!
提示詞訣竅列表: