AI生成圖片並非完全可控,所以需要很多額外手段去控制,這篇要來試試幾個方法讓生成的圖片更加可控。
首先來測試用數字去控制畫面人數。
為了不要太操自己的電腦,使用的是Tensor.Art線上服務。
使用的工作流如下圖。
為了將品質用提示詞跟內容用提示詞分開,使用了Conditioning (Combine)節點,只要在畫面中空白處連點兩下滑鼠右鍵開啟節點搜尋,輸入Combine就可以找到這個節點。
one girl, 1girl, a girl, 最常見的提示詞,對AI來說不算什麼。
很幸運地第一次就抽到了不錯的構圖,雖然臉有點不漂亮,但還可以。
當人數到達3人時,抽不太出3人,或是會抽出很奇怪的構圖,如一個人有3張臉,就不放上來傷眼了。
野心更大一點,一次要很多人,也是要抽一下,而且AI直接給我四張大頭照。
受不了直接叫AI畫打群架,結果都看不出臉了。
根據經驗,AI有時畫不出更多人是因為被圖像尺寸給限制住了,上一步測試使用的是512*512,下面我改變了一下尺寸,再次要求AI繪製3人以上圖像。
結果還是只能畫出2個人,但構圖跟畫面氛圍還不錯。
成功地畫出了3人畫面,感覺有什麼故事?
人數再往上加也還可以成功繪製,只是服裝有點單調。
因為人數再往上加就抽不太出準確的人數了,只好再來打個群架。
光靠著文字提示詞要AI畫出準確的人數有點強AI所難,因為受到生成圖像尺寸跟採用的模型限制,有些模型甚至在提示詞太少的情況下連一個人都畫不出來。
在這邊預告一下這個主題會是一個小小的連載主題,之後幾篇會再圍繞著這個主題去測試其他方法。
敬請期待。