方格子 vocus

柳暗花明又見冰宮【2023/4/23~26】

Bsh

發佈於AI越快，這裡則慢

2025/04/29 更新2025/04/29 發佈

既然 BiliBili 上分享的 LoRA 號稱可一鍵生成漫畫，這麼強大總該試試。我決定只寫prompt 來引導 AI 生成對應漫畫頁面，直到足以拼湊一段劇情為止，再來計算總共生成多少張、又從中採用多少張。

至於對話框與台詞還是要自己加，純靠畫面引導劇情很難喔。

產出結果 :

這哪有分鏡 ? 因為我想搞事，特意找了手遊 FGO 角色安娜塔西亞公主 LoRA，由於她的穿著繁複、人物提示衣著詞彙較多，AI 為呈現角色服裝，不免導致人物在畫面中佔比偏高，挑戰這個分鏡 LoRA 的呈現。提示單純寫【漫畫 LoRA + 角色 LoRA】，即使忽略無分格的情況，產生的分鏡也大多長這樣 :

漫畫框成為裝飾邊框，終究還是單圖的概念。

然後我想到，由於 Stable Diffusion 以 512 x 512 大小的圖進行訓練，AI 學會了在512~768 之間生成圖像。一旦多於這尺寸， AI 會覺得空間太多開始胡亂塞元素填補。這導致某些電腦好的使用者想直接生成高清大圖，結果只要 1girl 卻出現多人、人身上總多幾條肢體而困惑。~~何等奢侈的困境 !~~

那我直接生成 768x1024 的圖，反而能增加零碎空間、迫使 SD 塞入漫畫框元素 ?

出現比較多元的分鏡了，雖然大概是生成九張出現三張的機率

我的猜想有效，分鏡 LoRA 搭配這位角色會出現些非常奇特的分鏡方式，以至於我好奇當初投入哪些作品的漫畫頁供 AI 學習 :

少年漫畫很少出現這種，拿裝飾、植物、紋路來擔當分鏡框的作法吧 ?

接著是背景，純場景 prompt 寫再複雜也不影響分鏡存在 :

組合前面實驗，【漫畫 LoRA + 角色 LoRA + 場景提示】如此一大串，哪些元素會消失、哪些元素會留下呢 ?

結果我讓一長串人物 prompt 與一長串場景 prompt 兩位至尊大戰的後果，沒把大道磨滅反而讓畫面穩定下來了。這樣就能開始放對話框、寫對白 !

P.1~P.10

P.11~P.20

P.21~P.27

產圖的時候，對劇情完全沒有想法，只是設定好人物與場景，花更多時間在「從 10 張裡挑 2 張有可讀性的圖」然後「苦思為啥我的敘述會產生另外 8 張鬼畫符」，往往幾個權重改變、增減幾個單字，就發生根本沒分鏡/人物不見/場景不見/單色圖像/抽象花紋......各種難以掌握的狀況。但頁分鏡全由 AI 生成，我僅將其排列、詮釋出意義，是這場實驗成功達成的地方。

為了堆疊 27 頁的漫畫，共生成了 300 張圖。

期間獲得了充實感，回到接觸 Stable Diffusion 前，以 Wombo ai 製作胡鬧短篇（參見你聽過安科嗎?）的心情。或許我並不在意用什麼媒介畫、角色原不原創、手指髮絲衣襬細節有沒有出錯，能靠圖畫呈現一段故事便心滿意足。但 AI 本身的侷限性，使我過往嘗試時太著重如何解決問題，終究忽略創作的初衷、產量豐碩卻也尋找著理由。

至少最後理解了為何空乏，旅途盡頭是冰宮瑤華，

無論檔案保留或刪除，都是一個階段的圓滿謝幕。

Bsh的沙龍AI越快，這裡則慢AI越快，這裡則慢

留言

Bsh的沙龍