整裝待發,斬斷迷茫【2022/11/11】

整裝待發,斬斷迷茫【2022/11/11】

更新於 發佈於 閱讀時間約 4 分鐘

2022年11月8日,我被BiliBili一篇標題聳動的文章給釣到 : 

【NovelAI再遭洩露?實測對比Anything-V3.0.ckpt 提升巨大】


怎麼老是被外洩模型?NovelAI未免太衰!

我本來想大聲斥責的,但網路上已經找得到檔案了,真香。


事後顯示標題純屬誤傳,此模型並非NovelAI的資料,顯然之前外洩檔案激勵了大家,紛紛推出可以生成更佳二次元風格的模型。無論訓練新模型還是融合現有模型,都不是我這台小筆電能承受的事情,所以我選擇隨波逐流,哪些看來效果好再下載使用。


現在我有Stable Diffusion webUI、NovelAI、Anything-V3.0、三段式描述法、負向提示、線上各種提示詞整理......

新的思維、新的方法、新的工具,決定再來測試自己掌控畫面的能力 !


首先介紹一下本次主角,來自東方project的魂魄妖夢 :

隨著技術演進、程式效能提升,我的筆電最大已經可以生成1024x1024的圖了

隨著技術演進、程式效能提升,我的筆電最大已經可以生成1024x1024的圖了


欸不是,這穿著完全不對好嗎


看來Anything V3即使生成圖片更好看,依然需要提示詞引導才能符合使用者需求。所以我在提示詞內加入這個角色的衣著詳細敘述,再來繼續生成 :

raw-image

AnythingV3還是記得角色的,簡單輸入綠背心、白襯衫、綠裙,衣著細節竟然有呈現,儘管右手腕被劍遮住的部份因為AI無法理解立體空間而似乎被劍身"取代",並且這種姿勢隨時有切腹之虞。

再用Novelai模型跑一次,比對兩種模型風格差異 :

raw-image

可以發現AnythingV3畫面似乎比Novelai明亮,考量白玉樓冥界居所的設定,Novelai較能呈現構想中櫻花紛飛、繁星點點的夜晚意象。11月當時恰好看了動畫《路人超能100》第三季神樹篇的重要時刻,滿懷觀影後的澎湃,讓妖夢直面一顆浮空大樹會是多有張力的畫面?


當需求更加具體,考驗才真正降臨。

AI生成圖片往往讓人物置中看鏡頭,搞得像在Cosplay擺拍一樣

AI生成圖片往往讓人物置中看鏡頭,搞得像在Cosplay擺拍一樣

終於讓人物站遠景,櫻花樹很容易成為把視覺引導到人物身上的邊角點綴

終於讓人物站遠景,櫻花樹很容易成為把視覺引導到人物身上的邊角點綴

加強畫面中央櫻花樹的權重,結果樹變成近景人物跑到遠景

加強畫面中央櫻花樹的權重,結果樹變成近景人物跑到遠景

而且重點是我要讓櫻花樹飛天啊

靠prompt唯一讓櫻花樹上天(?)的一張

靠prompt唯一讓櫻花樹上天(?)的一張

妖夢是要砍櫻花樹,不是砍空想樹!!!!!


產了幾十張圖遲遲達不到想要的效果,只好再次使用圖生圖功能,簡單畫張示意圖 :

raw-image

整張圖以仰式視角,

從妖夢身後和她一起仰望空中的巨大櫻花樹,

妖夢手裡拿著她配戴的兩把長劍,

噢對如果整體能帶點魚眼視角效果更好~~


第一代圖生圖

raw-image

為什麼那棵樹看起來這麼3D?

姿勢雖然很準確,但有人武器是這樣握?

而且妖夢拿的是長劍啊 ! 不是刀啊 !


第二代圖生圖

raw-image

雖然我贊同畫出樹根能加強浮空感,但這種展示方式未免粗暴了點。

現在拿武器的姿勢比較正常,反而是武器本身更不正常了。


第三代圖生圖

raw-image

​樹木帶點朦朧,搭配空中發光的花瓣有助於加強空間的體積感。

可惜地面被劍分隔的區域左右不齊。

人物整體線條更好了,呈現出因為身體前進而些微晃動的曲線。

但我不記得妖夢是三刀流?


第四代圖生圖

raw-image

調暗背景天空並加入繁星表示現在為夜晚,

人物衣著添入更多細節,若觀察地面植被分布,可發現已有魚眼效果。


第五代圖生圖

raw-image

調深天色、加上雲彩

頭髮與裙襬飄逸效果已經讓我滿意,

但妖夢也從雙手持劍,變成單手拿感覺就是很容易砍到自己的奇怪武器...


除示意圖外,其他圖片全部沒有動筆修飾,僅靠AI生成與手動挑選反覆迭代,整個圖生圖流程總共產出56張圖來篩選。雖然樹下半部被人擋住,要說那棵樹只是特別瘦高而已沒有飛天,我也無法反駁。


但不可否認的是,這次試驗讓我感受到前所未有的控制感。再也不用先文生圖準備真人圖片、再圖生圖修成二次元風格,簡易塗鴉竟能蛻變為遠觀沒什麼大問題的圖畫,感覺已經蒐集足夠配備應付各種試煉,是時候向前邁進、迎向挑戰了 !


( 劍 : 你要不要聽聽看你現在到底在講什麼 )

avatar-img
Bsh的沙龍
3會員
47內容數
記錄我在 2022 年 9 月之後使用 AI 生成圖像的嘗試。 這個主題總有一天會沒東西好寫,那就走一步算一步吧...…
留言
avatar-img
留言分享你的想法!
Bsh的沙龍 的其他內容
2022 年 10 月是創新與挑戰並存的月份,人們進行天馬行空的測試,投石問路功不唐捐,都是疊起邁向 AIGC 領域深處的墊腳石。但提示詞未免太長了吧???
2022 下半年的 AI 圖像生成技術這麼難用,為什麼還能掀起熱潮? 因為 AI 產的怪圖太怪了。
自 NovelAI 官方發推提及自家 AI 模型學習 Danbooru 圖庫後,有網友抓包 AI 餵太多帶有繪師簽名的圖片,連自己生成的圖片都出現簽名了。但這大概不是人工智慧覺醒黎明。
自 NovelAI 模型外洩後,技術人士分析該模型如何在二次元風格表現優異、普通愛好者則將目光鎖定在 Danbooru tag 庫上,是為大 prompt 時代。
因為 SD 慢慢跑也是跑得動,我一向懶得關注線上付費 AI 圖像生成資源,但當時仍有件事讓專注於本機的我注目,也就是 2022/10/3 推出圖像生成服務的網站 NovelAI, 10/6模型就外洩啦!!!
「內耗」一詞源自物理學,和方格子當期主題談的「精神內耗」是兩碼事,加上本沙龍刊載文章似乎界定在書寫自己嘗試 AI 圖像生成的紀錄,完全離題,發這篇文顯然只想湊熱鬧蹭一波點擊率......嗎?
2022 年 10 月是創新與挑戰並存的月份,人們進行天馬行空的測試,投石問路功不唐捐,都是疊起邁向 AIGC 領域深處的墊腳石。但提示詞未免太長了吧???
2022 下半年的 AI 圖像生成技術這麼難用,為什麼還能掀起熱潮? 因為 AI 產的怪圖太怪了。
自 NovelAI 官方發推提及自家 AI 模型學習 Danbooru 圖庫後,有網友抓包 AI 餵太多帶有繪師簽名的圖片,連自己生成的圖片都出現簽名了。但這大概不是人工智慧覺醒黎明。
自 NovelAI 模型外洩後,技術人士分析該模型如何在二次元風格表現優異、普通愛好者則將目光鎖定在 Danbooru tag 庫上,是為大 prompt 時代。
因為 SD 慢慢跑也是跑得動,我一向懶得關注線上付費 AI 圖像生成資源,但當時仍有件事讓專注於本機的我注目,也就是 2022/10/3 推出圖像生成服務的網站 NovelAI, 10/6模型就外洩啦!!!
「內耗」一詞源自物理學,和方格子當期主題談的「精神內耗」是兩碼事,加上本沙龍刊載文章似乎界定在書寫自己嘗試 AI 圖像生成的紀錄,完全離題,發這篇文顯然只想湊熱鬧蹭一波點擊率......嗎?
本篇參與的主題活動
身為一個經常在行天宮發呆兼寫作的人……欸對,我都會坐在廟前一排階梯打限動跟文章,待在行天宮很容易文思泉涌。也包含,我對行天宮的籤詩運作,不敢說真理,但和祂們相處久,抽的籤詩多,對照的現實也多,自然就發現了神明的弔詭之處。 會寫這篇,是來自昨天遇到一位女孩,我認為她的頻率反映了時下人,尤其想要以
身為一個經常在行天宮發呆兼寫作的人……欸對,我都會坐在廟前一排階梯打限動跟文章,待在行天宮很容易文思泉涌。也包含,我對行天宮的籤詩運作,不敢說真理,但和祂們相處久,抽的籤詩多,對照的現實也多,自然就發現了神明的弔詭之處。 會寫這篇,是來自昨天遇到一位女孩,我認為她的頻率反映了時下人,尤其想要以