2024-10-22|閱讀時間 ‧ 約 0 分鐘

眾裡尋Waifu千百度【2022/10/8】

經過努力嘗試,我實在很難把" AI 生成圖像"與"繪圖"產生連結。


如果回顧在方格子發布的這系列文章,可以發現我都用 "AI 生成"、" AI 產圖"之類的詞彙,而非" AI 繪圖"來描述這種新興創作型式。因為個人對創作的理解便是我手寫我腦,將自己的創意、理念、靈感以各種方式如實記錄,但剛推出一個多月的 AI 生成圖像功能隨機性實在太高,以至於應用 AI 輔助創作的嘗試實在過於慘烈,望著滿屏扭曲偽人圖像,察覺自己對人類美麗的標準不斷突破下限,不免感嘆"繪圖"什麼時候是如此麻煩的事情了?


但如果無法克服人體這一關,如何讓角色去推演更多發展性?


2022 年 10 月初,專門用於生成二次元角色的模型 Waifu Diffusion 釋出。我看見當下立即下載,這名字讓我備感熟悉,因為 2019 年曾經玩過 Waifu Labs 一小段時間,該網站會隨機生成 15 格人物頭像(+1 格重置按鈕),挑選一張喜歡的,下一步挑選同人物不同配色,再下一步挑選同畫面布局不同畫風,就可以得到同樣畫風同樣配色的角色頭像無限生成,儘管髮型、配件等細節會有差異。


相較於 2017 年推出、可調整髮色髮型配件的 AI 生成二次元頭像網站 MakeGirlsMo,Waifu Labs 顯得比較遊戲化,不讓使用者操作時苦惱於想人設,透過簡單直覺的比較/點擊,獲得自己挑選而喜歡的結果,或許是當時吸引我有空就上去逛的原因?

隨意逛逛的結果91x8=728


但 Waifu Labs 挑起來好玩是因為人物夠可愛,

要我從一堆偽人裡面找出一個正常人,這算啥克蘇魯版威利在哪裡???


後來 2020 年推出的 Crypko 則結合時下熱門的加密貨幣,用戶可 AI 生成自己的二次元人物,在市場上透過以太幣交易,再用兩張不同的人物圖像"合成"出新的人物。對畫人不行而想靠AI輔助的自己來說,這卻過於遊戲化了,只想完成人設,得先開戶、交易、合成?沒有技術力的我對 AI 生成人物的探究,因此停擺於當時。


Stable Diffusion 雖讓 AI 圖像生成能夠在本機實現,要達成需求仍然困難,且因設備限制不符效益,繼續探究下去恐怕很難有什麼突破了。難道當時情境再度重演,又得暫時遠離 AI 生成這個課題一陣子......


如今冠有 "Waifu" 名號的新玩意出現,或許事情發展會不同?

WD v1.2版本還是可以創造磅礡空間感

沿用之前試出的電影海報prompt,效果依然讚


問題是二次元人物往往凸顯眼睛並淡化其他五官,若用真人圖像 image to image,學習動漫畫圖像資料的 WD v1.2 模型放大眼睛的傾向會比 SD 模型明顯,但結構受限於原圖真人,成為一個身體比例像真人、眼睛又不自然放大的怪東西,如果臉佔畫面比例太小,反而比用 SD 模型圖生圖更接近恐怖谷底。

把這張圖人物按比例縮小,但眼睛保持原本大小...差不多就是i2i產出的失敗品長相


幸好 WD v1.3 迅速推出,上述 v1.2 碰到的問題在新版本中已有改善,我另外嘗試以二次元人物圖進行圖生圖,將原圖人物替換為提示詞人物,老問題 ControlNet 還沒出現完全只能碰運氣。不過此時 WD 已非吳下阿蒙,靠敘述生成二次元角色更方便。

尤其東方project角色大都打名字便可出現,特徵敘述則為穩定產出品質

但我老想把角色塞進繁複背景中,結果便是人物與環境畫風不一樣啊~

如此一來,AI將有辦法生成"塞入特定角色的海報"

儘管隨著圖內元素越多,角色也越容易失真

但我們得相信人類睿智的聯想能力啊!


AI 生成是個令人又愛又恨的主題,心中存在美好的創作自由想像,眼前所見盡是無法忽視的缺陷挑戰,即便這系列文章才寫到 2022 年 10 月初,接下來兩年日子裡情緒如潮水漲落,必須時時叩問動機、調整方向,沉沒成本才不會白費,因為非相關領域人士的我,沒心力也沒必要 AI 生成圖像、文字、影像、音樂一把抓,但願眾裡尋找千百度的、尚未明朗真面目的"它",



依然站在燈火闌珊處,只待我驀然回首。


分享至
成為作者繼續創作的動力吧!
從 Google News 追蹤更多 vocus 的最新精選內容從 Google News 追蹤更多 vocus 的最新精選內容

作者的相關文章

Bsh的沙龍 的其他內容

你可能也想看

發表回應

成為會員 後即可發表留言
© 2024 vocus All rights reserved.