2024-08-25|閱讀時間 ‧ 約 9 分鐘

AI midjourney保持人物的一致性


我在YOUTUBE有音樂頻道,內容主要以Relax 休閒音樂為主,無論是工作或是睡前都可以撥放來聽,而且音樂有助於放鬆心情,能提升高作效率以及快速進入深層睡眠,歡迎各位參考及訂閱喔,謝謝各位!

YOUTUBE訂閱是免費的喔。

我的頻道:https://www.youtube.com/@Goodnight-i2y


Hello everyone,各位觀眾今天來談談AI創建圖片的最大難題,如何保持人物的一致性,這個問題到目前為止,應該都還是AI生成圖片的一大痛點,因為如果今天,不管你是要寫故事,做個專案或是寫寫封面照片都好,每一次AI生成的圖片,都無法保持人物的一致性(或是說臉蛋的一致性)。

像今天我要寫一則兒童故事好了,前一張圖的臉孔也許是個金髮小女孩,下一張生成的圖片,主角可能就變成東方的小女孩,這樣的巨大變化,就會讓整個故事演不下去,觀眾也會看得頭昏眼花,完全搞不懂哪一個才是真正的主角?

今天我們就拿小紅帽這個兒童故事來做個例子說明好了。

故事小紅帽的大意大概是

從前有一個女孩叫做小紅帽,她有個奶奶住在森林的那一邊,小紅帽經常去探望奶奶,有一天媽媽拿了一籃的食物要請小紅帽送給奶奶,不料小紅帽在半路遇上了狡猾的野狼,野狼故意騙小紅帽讓她繞遠路。

野狼則自己抄捷徑,先趕往小紅帽的奶奶家中,把奶奶吃掉了。接著小紅帽來找奶奶,此時野狼穿著奶奶的衣服,假扮成奶奶準備吃掉小紅帽,不料被小紅帽識破,就聯合獵人將野狼殺掉,幫奶奶報了仇。

這張是封面圖片生成的小女孩

這張是小紅帽獨自走進森林的照片,跟上一張差異不算太大

這張是小紅帽蓆著食物要去找奶奶著照片,已經出現明顯差異了

這是另一張小紅帽走進森林的照片,跟其他張比起來就有頗大的差異

為了克服人物不一致對創作者造成的莫大困擾,midjourney也開發出cref這個參數,官方說法,這個參數可以將人物的臉孔一致化,因為不知道它到底能做到什麼程度,所以我們就一起來試試看吧!

首先我們要找一張基礎照片,這裡有一個條件限制,就是這張照片必須是由Midjourney所生成的,否則就會無法使用。

我們就拿前幾天,做出來的麥當當女孩來當範例好了,這張圖片描述一個美麗的女孩,穿著黑色防彈背心,拿著一包麥當勞薯條,站在東京的街頭。

然後我們就寫上不同的描述內容,看看Midjourney的Cref這個參數,到底能做到甚麼樣的程度?

上面的這幾張照片,神韻大概抓住6~7成,但是臉蛋較圓潤,跟基礎照片有稍稍不同。

這幾張的照片精準度來到8~9成,跟基礎照片的臉蛋較為相似,呈現較長的臉型,笑容及牙齒細節也跟基礎照片較為相似,只是有些細節跟基礎照片還是有些差異。

但是這對AI使用者來說,已經是個很大的進步了,至少不會完全分不清楚主角是哪一位,不過,我還是希望有一天可以做到100%的還原度。

相關語法寫法如下,有興趣的觀眾可以參考一下喔~

A beautiful Japanese woman stands on the street of Kyoto, wearing a red bikini and holding a large piece of McDonald's French fries with a smile and excited expression on her face, cref https://s.mj.run/JQYoEBodpGQ - -ar 16: 9 --v 6.1

 

分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.