既然 BiliBili 上分享的 LoRA 號稱可一鍵生成漫畫,這麼強大總該試試。我決定只寫prompt 來引導 AI 生成對應漫畫頁面,直到足以拼湊一段劇情為止,再來計算總共生成多少張、又從中採用多少張。
產出結果 :

這哪有分鏡 ? 因為我想搞事,特意找了手遊 FGO 角色安娜塔西亞公主 LoRA,由於她的穿著繁複、人物提示衣著詞彙較多,AI 為呈現角色服裝,不免導致人物在畫面中佔比偏高,挑戰這個分鏡 LoRA 的呈現。提示單純寫【漫畫 LoRA + 角色 LoRA】,即使忽略無分格的情況,產生的分鏡也大多長這樣 :

漫畫框成為裝飾邊框,終究還是單圖的概念。
然後我想到,由於 Stable Diffusion 以 512 x 512 大小的圖進行訓練,AI 學會了在512~768 之間生成圖像。一旦多於這尺寸, AI 會覺得空間太多開始胡亂塞元素填補。這導致某些電腦好的使用者想直接生成高清大圖,結果只要 1girl 卻出現多人、人身上總多幾條肢體而困惑。何等奢侈的困境 !
那我直接生成 768x1024 的圖,反而能增加零碎空間、迫使 SD 塞入漫畫框元素 ?

出現比較多元的分鏡了,雖然大概是生成九張出現三張的機率
我的猜想有效,分鏡 LoRA 搭配這位角色會出現些非常奇特的分鏡方式,以至於我好奇當初投入哪些作品的漫畫頁供 AI 學習 :

少年漫畫很少出現這種,拿裝飾、植物、紋路來擔當分鏡框的作法吧 ?
接著是背景,純場景 prompt 寫再複雜也不影響分鏡存在 :

組合前面實驗,【漫畫 LoRA + 角色 LoRA + 場景提示】如此一大串 ,哪些元素會消失、哪些元素會留下呢 ?

結果我讓一長串人物 prompt 與一長串場景 prompt 兩位至尊大戰的後果,沒把大道磨滅反而讓畫面穩定下來了。這樣就能開始放對話框、寫對白 !
P.1~P.10
P.11~P.20
P.21~P.27
產圖的時候,對劇情完全沒有想法,只是設定好人物與場景,花更多時間在「從 10 張裡挑 2 張有可讀性的圖」然後「苦思為啥我的敘述會產生另外 8 張鬼畫符」,往往幾個權重改變、增減幾個單字,就發生根本沒分鏡/人物不見/場景不見/單色圖像/抽象花紋......各種難以掌握的狀況。但頁分鏡全由 AI 生成,我僅將其排列、詮釋出意義,是這場實驗成功達成的地方。
為了堆疊 27 頁的漫畫,共生成了 300 張圖。
期間獲得了充實感,回到接觸 Stable Diffusion 前,以 Wombo ai 製作胡鬧短篇(參見你聽過安科嗎?)的心情。或許我並不在意用什麼媒介畫、角色原不原創、手指髮絲衣襬細節有沒有出錯,能靠圖畫呈現一段故事便心滿意足。但 AI 本身的侷限性,使我過往嘗試時太著重如何解決問題,終究忽略創作的初衷、產量豐碩卻也尋找著理由。
至少最後理解了為何空乏,旅途盡頭是冰宮瑤華,
無論檔案保留或刪除,都是一個階段的圓滿謝幕。