眾裡尋Waifu千百度【2022/10/8】

2024/10/22 更新2024/10/22 發佈閱讀 4 分鐘

經過努力嘗試，我實在很難把" AI 生成圖像"與"繪圖"產生連結。

如果回顧在方格子發布的這系列文章，可以發現我都用 "AI 生成"、" AI 產圖"之類的詞彙，而非" AI 繪圖"來描述這種新興創作型式。因為個人對創作的理解便是我手寫我腦，將自己的創意、理念、靈感以各種方式如實記錄，但剛推出一個多月的 AI 生成圖像功能隨機性實在太高，以至於應用 AI 輔助創作的嘗試實在過於慘烈，望著滿屏扭曲偽人圖像，察覺自己對人類美麗的標準不斷突破下限，不免感嘆"繪圖"什麼時候是如此麻煩的事情了?

但如果無法克服人體這一關，如何讓角色去推演更多發展性?

2022 年 10 月初，專門用於生成二次元角色的模型 Waifu Diffusion 釋出。我看見當下立即下載，這名字讓我備感熟悉，因為 2019 年曾經玩過 Waifu Labs 一小段時間，該網站會隨機生成 15 格人物頭像(+1 格重置按鈕)，挑選一張喜歡的，下一步挑選同人物不同配色，再下一步挑選同畫面布局不同畫風，就可以得到同樣畫風同樣配色的角色頭像無限生成，儘管髮型、配件等細節會有差異。

相較於 2017 年推出、可調整髮色髮型配件的 AI 生成二次元頭像網站 MakeGirlsMo，Waifu Labs 顯得比較遊戲化，不讓使用者操作時苦惱於想人設，透過簡單直覺的比較/點擊，獲得自己挑選而喜歡的結果，或許是當時吸引我有空就上去逛的原因?

隨意逛逛的結果91x8=728

但 Waifu Labs 挑起來好玩是因為人物夠可愛，

~~要我從一堆偽人裡面找出一個正常人，這算啥克蘇魯版威利在哪裡???~~

後來 2020 年推出的 Crypko 則結合時下熱門的加密貨幣，用戶可 AI 生成自己的二次元人物，在市場上透過以太幣交易，再用兩張不同的人物圖像"合成"出新的人物。對畫人不行而想靠AI輔助的自己來說，這卻過於遊戲化了，只想完成人設，得先開戶、交易、合成?沒有技術力的我對 AI 生成人物的探究，因此停擺於當時。

Stable Diffusion 雖讓 AI 圖像生成能夠在本機實現，要達成需求仍然困難，且因設備限制不符效益，繼續探究下去恐怕很難有什麼突破了。難道當時情境再度重演，又得暫時遠離 AI 生成這個課題一陣子......

如今冠有 "Waifu" 名號的新玩意出現，或許事情發展會不同?

WD v1.2版本還是可以創造磅礡空間感

沿用之前試出的電影海報prompt，效果依然讚

問題是二次元人物往往凸顯眼睛並淡化其他五官，若用真人圖像 image to image，學習動漫畫圖像資料的 WD v1.2 模型放大眼睛的傾向會比 SD 模型明顯，但結構受限於原圖真人，成為一個身體比例像真人、眼睛又不自然放大的怪東西，如果臉佔畫面比例太小，反而比用 SD 模型圖生圖更接近恐怖谷底。

把這張圖人物按比例縮小，但眼睛保持原本大小...差不多就是i2i產出的失敗品長相

幸好 WD v1.3 迅速推出，上述 v1.2 碰到的問題在新版本中已有改善，我另外嘗試以二次元人物圖進行圖生圖，將原圖人物替換為提示詞人物，老問題 ControlNet 還沒出現完全只能碰運氣。不過此時 WD 已非吳下阿蒙，靠敘述生成二次元角色更方便。

尤其東方project角色大都打名字便可出現，特徵敘述則為穩定產出品質

但我老想把角色塞進繁複背景中，結果便是人物與環境畫風不一樣啊~

如此一來，AI將有辦法生成"塞入特定角色的海報"

儘管隨著圖內元素越多，角色也越容易失真

但我們得相信人類睿智的聯想能力啊!

AI 生成是個令人又愛又恨的主題，心中存在美好的創作自由想像，眼前所見盡是無法忽視的缺陷挑戰，即便這系列文章才寫到 2022 年 10 月初，接下來兩年日子裡情緒如潮水漲落，必須時時叩問動機、調整方向，沉沒成本才不會白費，因為非相關領域人士的我，沒心力也沒必要 AI 生成圖像、文字、影像、音樂一把抓，但願眾裡尋找千百度的、尚未明朗真面目的"它"，

依然站在燈火闌珊處，只待我驀然回首。

Bsh的沙龍AI越快，這裡則慢AI越快，這裡則慢

留言

Bsh的沙龍

3會員

50內容數

記錄我在 2022 年 9 月之後使用 AI 生成圖像的嘗試。這個主題總有一天會沒東西好寫，那就走一步算一步吧...…

Bsh的沙龍的其他內容

2025/04/29

柳暗花明又見冰宮【2023/4/23~26】

既然 BiliBili 上分享的 LoRA 號稱可一鍵生成漫畫，我決定只寫 prompt 來引導 AI 生成漫畫頁，直到足以拼湊一段劇情為止，再來計算總共生成多少張、又從中採用多少張。

2025/04/29

柳暗花明又見冰宮【2023/4/23~26】

2025/04/22

山窮水盡前路茫然【2024/4/23】

或許舊作品消滅與 AI 生成風潮，只是證實內心對圖像價值的質疑。諷刺的是，我竟因為懶得開 SD 、漫無目的上網而看到新的可能性。

2025/04/22

山窮水盡前路茫然【2024/4/23】

或許舊作品消滅與 AI 生成風潮，只是證實內心對圖像價值的質疑。諷刺的是，我竟因為懶得開 SD 、漫無目的上網而看到新的可能性。

2025/04/15

萬般繪法有時盡【2023/4】

測過 ChatGPT 寫提示的效果，我再無懸念，自己目前的流程問題開張 Google sheet 便能解決，用不著 AI。

2025/04/15

萬般繪法有時盡【2023/4】

測過 ChatGPT 寫提示的效果，我再無懸念，自己目前的流程問題開張 Google sheet 便能解決，用不著 AI。

#AI創作的其他內容

AI工具怎麼幫助我們學習程式－ChatGPT的實踐與範例

Ken Chen 的沙龍

AWS SageMaker 開箱體驗

西尼亞ming的沙龍

沒有機器學習經驗的我嘗試了 Amazon SageMaker JumpStart

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品，以十段寓言式殘篇，重新拼貼記憶、暴力與美學，並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇：帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略，嘗試解析極權底下不可言說之事，將如何成為可被觀看的公共發聲。

#釀電影#釀評論#藝術評論

2026/01/14

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

#釀電影#釀評論#藝術評論

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

柏林劇團在 2026 北藝嚴選，再次帶來由布萊希特改編的經典劇目《三便士歌劇》（The Threepenny Opera），導演巴里・柯斯基以舞台結構與舞台調度，重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核，藉由沉浸與疏離的辯證，解析此作如何再次照見觀眾自身的位置。

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲．蓋柏樂》的詮釋，從劇本歷史、聲響與舞臺設計，到演員的主體創作方法，探討此版本如何讓經典劇作在當代劇場語境下煥發新生，滿足現代觀眾的觀看慾望。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

《轉轉生》為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，融合舞蹈、音樂、時尚和視覺藝術，透過身體、服裝與群舞結構，回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發，分析《轉轉生》如何以當代目光，形塑去殖民視角的奈及利亞歷史。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14