2024-11-26|閱讀時間 ‧ 約 0 分鐘

整裝待發,斬斷迷茫【2022/11/11】

2022年11月8日,我被BiliBili一篇標題聳動的文章給釣到 : 

【NovelAI再遭洩露?實測對比Anything-V3.0.ckpt 提升巨大】


怎麼老是被外洩模型?NovelAI未免太衰!

我本來想大聲斥責的,但網路上已經找得到檔案了,真香。


事後顯示標題純屬誤傳,此模型並非NovelAI的資料,顯然之前外洩檔案激勵了大家,紛紛推出可以生成更佳二次元風格的模型。無論訓練新模型還是融合現有模型,都不是我這台小筆電能承受的事情,所以我選擇隨波逐流,哪些看來效果好再下載使用。


現在我有Stable Diffusion webUI、NovelAI、Anything-V3.0、三段式描述法、負向提示、線上各種提示詞整理......

新的思維、新的方法、新的工具,決定再來測試自己掌控畫面的能力 !


首先介紹一下本次主角,來自東方project的魂魄妖夢 :

隨著技術演進、程式效能提升,我的筆電最大已經可以生成1024x1024的圖了


欸不是,這穿著完全不對好嗎


看來Anything V3即使生成圖片更好看,依然需要提示詞引導才能符合使用者需求。所以我在提示詞內加入這個角色的衣著詳細敘述,再來繼續生成 :

AnythingV3還是記得角色的,簡單輸入綠背心、白襯衫、綠裙,衣著細節竟然有呈現,儘管右手腕被劍遮住的部份因為AI無法理解立體空間而似乎被劍身"取代",並且這種姿勢隨時有切腹之虞。

再用Novelai模型跑一次,比對兩種模型風格差異 :

可以發現AnythingV3畫面似乎比Novelai明亮,考量白玉樓冥界居所的設定,Novelai較能呈現構想中櫻花紛飛、繁星點點的夜晚意象。11月當時恰好看了動畫《路人超能100》第三季神樹篇的重要時刻,滿懷觀影後的澎湃,讓妖夢直面一顆浮空大樹會是多有張力的畫面?


當需求更加具體,考驗才真正降臨。

AI生成圖片往往讓人物置中看鏡頭,搞得像在Cosplay擺拍一樣

終於讓人物站遠景,櫻花樹很容易成為把視覺引導到人物身上的邊角點綴

加強畫面中央櫻花樹的權重,結果樹變成近景人物跑到遠景

而且重點是我要讓櫻花樹飛天啊

靠prompt唯一讓櫻花樹上天(?)的一張

妖夢是要砍櫻花樹,不是砍空想樹!!!!!


產了幾十張圖遲遲達不到想要的效果,只好再次使用圖生圖功能,簡單畫張示意圖 :

整張圖以仰式視角,

從妖夢身後和她一起仰望空中的巨大櫻花樹,

妖夢手裡拿著她配戴的兩把長劍,

噢對如果整體能帶點魚眼視角效果更好~~


第一代圖生圖

為什麼那棵樹看起來這麼3D?

姿勢雖然很準確,但有人武器是這樣握?

而且妖夢拿的是長劍啊 ! 不是刀啊 !


第二代圖生圖

雖然我贊同畫出樹根能加強浮空感,但這種展示方式未免粗暴了點。

現在拿武器的姿勢比較正常,反而是武器本身更不正常了。


第三代圖生圖

​樹木帶點朦朧,搭配空中發光的花瓣有助於加強空間的體積感。

可惜地面被劍分隔的區域左右不齊。

人物整體線條更好了,呈現出因為身體前進而些微晃動的曲線。

但我不記得妖夢是三刀流?


第四代圖生圖

調暗背景天空並加入繁星表示現在為夜晚,

人物衣著添入更多細節,若觀察地面植被分布,可發現已有魚眼效果。


第五代圖生圖

調深天色、加上雲彩

頭髮與裙襬飄逸效果已經讓我滿意,

但妖夢也從雙手持劍,變成單手拿感覺就是很容易砍到自己的奇怪武器...


除示意圖外,其他圖片全部沒有動筆修飾,僅靠AI生成與手動挑選反覆迭代,整個圖生圖流程總共產出56張圖來篩選。雖然樹下半部被人擋住,要說那棵樹只是特別瘦高而已沒有飛天,我也無法反駁。


但不可否認的是,這次試驗讓我感受到前所未有的控制感。再也不用先文生圖準備真人圖片、再圖生圖修成二次元風格,簡易塗鴉竟能蛻變為遠觀沒什麼大問題的圖畫,感覺已經蒐集足夠配備應付各種試煉,是時候向前邁進、迎向挑戰了 !


( 劍 : 你要不要聽聽看你現在到底在講什麼 )

分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.