經過努力嘗試,我實在很難把" AI 生成圖像"與"繪圖"產生連結。
如果回顧在方格子發布的這系列文章,可以發現我都用 "AI 生成"、" AI 產圖"之類的詞彙,而非" AI 繪圖"來描述這種新興創作型式。因為個人對創作的理解便是我手寫我腦,將自己的創意、理念、靈感以各種方式如實記錄,但剛推出一個多月的 AI 生成圖像功能隨機性實在太高,以至於應用 AI 輔助創作的嘗試實在過於慘烈,望著滿屏扭曲偽人圖像,察覺自己對人類美麗的標準不斷突破下限,不免感嘆"繪圖"什麼時候是如此麻煩的事情了?
但如果無法克服人體這一關,如何讓角色去推演更多發展性?
2022 年 10 月初,專門用於生成二次元角色的模型 Waifu Diffusion 釋出。我看見當下立即下載,這名字讓我備感熟悉,因為 2019 年曾經玩過 Waifu Labs 一小段時間,該網站會隨機生成 15 格人物頭像(+1 格重置按鈕),挑選一張喜歡的,下一步挑選同人物不同配色,再下一步挑選同畫面布局不同畫風,就可以得到同樣畫風同樣配色的角色頭像無限生成,儘管髮型、配件等細節會有差異。
相較於 2017 年推出、可調整髮色髮型配件的 AI 生成二次元頭像網站 MakeGirlsMo,Waifu Labs 顯得比較遊戲化,不讓使用者操作時苦惱於想人設,透過簡單直覺的比較/點擊,獲得自己挑選而喜歡的結果,或許是當時吸引我有空就上去逛的原因?
但 Waifu Labs 挑起來好玩是因為人物夠可愛,
要我從一堆偽人裡面找出一個正常人,這算啥克蘇魯版威利在哪裡???
後來 2020 年推出的 Crypko 則結合時下熱門的加密貨幣,用戶可 AI 生成自己的二次元人物,在市場上透過以太幣交易,再用兩張不同的人物圖像"合成"出新的人物。對畫人不行而想靠AI輔助的自己來說,這卻過於遊戲化了,只想完成人設,得先開戶、交易、合成?沒有技術力的我對 AI 生成人物的探究,因此停擺於當時。
Stable Diffusion 雖讓 AI 圖像生成能夠在本機實現,要達成需求仍然困難,且因設備限制不符效益,繼續探究下去恐怕很難有什麼突破了。難道當時情境再度重演,又得暫時遠離 AI 生成這個課題一陣子......
如今冠有 "Waifu" 名號的新玩意出現,或許事情發展會不同?
問題是二次元人物往往凸顯眼睛並淡化其他五官,若用真人圖像 image to image,學習動漫畫圖像資料的 WD v1.2 模型放大眼睛的傾向會比 SD 模型明顯,但結構受限於原圖真人,成為一個身體比例像真人、眼睛又不自然放大的怪東西,如果臉佔畫面比例太小,反而比用 SD 模型圖生圖更接近恐怖谷底。
幸好 WD v1.3 迅速推出,上述 v1.2 碰到的問題在新版本中已有改善,我另外嘗試以二次元人物圖進行圖生圖,將原圖人物替換為提示詞人物,老問題 ControlNet 還沒出現完全只能碰運氣。不過此時 WD 已非吳下阿蒙,靠敘述生成二次元角色更方便。
AI 生成是個令人又愛又恨的主題,心中存在美好的創作自由想像,眼前所見盡是無法忽視的缺陷挑戰,即便這系列文章才寫到 2022 年 10 月初,接下來兩年日子裡情緒如潮水漲落,必須時時叩問動機、調整方向,沉沒成本才不會白費,因為非相關領域人士的我,沒心力也沒必要 AI 生成圖像、文字、影像、音樂一把抓,但願眾裡尋找千百度的、尚未明朗真面目的"它",
依然站在燈火闌珊處,只待我驀然回首。