眾裡尋Waifu千百度【2022/10/8】

更新於 2024/10/22閱讀時間約 4 分鐘

經過努力嘗試,我實在很難把" AI 生成圖像"與"繪圖"產生連結。


如果回顧在方格子發布的這系列文章,可以發現我都用 "AI 生成"、" AI 產圖"之類的詞彙,而非" AI 繪圖"來描述這種新興創作型式。因為個人對創作的理解便是我手寫我腦,將自己的創意、理念、靈感以各種方式如實記錄,但剛推出一個多月的 AI 生成圖像功能隨機性實在太高,以至於應用 AI 輔助創作的嘗試實在過於慘烈,望著滿屏扭曲偽人圖像,察覺自己對人類美麗的標準不斷突破下限,不免感嘆"繪圖"什麼時候是如此麻煩的事情了?


但如果無法克服人體這一關,如何讓角色去推演更多發展性?


2022 年 10 月初,專門用於生成二次元角色的模型 Waifu Diffusion 釋出。我看見當下立即下載,這名字讓我備感熟悉,因為 2019 年曾經玩過 Waifu Labs 一小段時間,該網站會隨機生成 15 格人物頭像(+1 格重置按鈕),挑選一張喜歡的,下一步挑選同人物不同配色,再下一步挑選同畫面布局不同畫風,就可以得到同樣畫風同樣配色的角色頭像無限生成,儘管髮型、配件等細節會有差異。


相較於 2017 年推出、可調整髮色髮型配件的 AI 生成二次元頭像網站 MakeGirlsMo,Waifu Labs 顯得比較遊戲化,不讓使用者操作時苦惱於想人設,透過簡單直覺的比較/點擊,獲得自己挑選而喜歡的結果,或許是當時吸引我有空就上去逛的原因?

隨意逛逛的結果91x8=728

隨意逛逛的結果91x8=728


但 Waifu Labs 挑起來好玩是因為人物夠可愛,

要我從一堆偽人裡面找出一個正常人,這算啥克蘇魯版威利在哪裡???


後來 2020 年推出的 Crypko 則結合時下熱門的加密貨幣,用戶可 AI 生成自己的二次元人物,在市場上透過以太幣交易,再用兩張不同的人物圖像"合成"出新的人物。對畫人不行而想靠AI輔助的自己來說,這卻過於遊戲化了,只想完成人設,得先開戶、交易、合成?沒有技術力的我對 AI 生成人物的探究,因此停擺於當時。


Stable Diffusion 雖讓 AI 圖像生成能夠在本機實現,要達成需求仍然困難,且因設備限制不符效益,繼續探究下去恐怕很難有什麼突破了。難道當時情境再度重演,又得暫時遠離 AI 生成這個課題一陣子......


如今冠有 "Waifu" 名號的新玩意出現,或許事情發展會不同?

WD v1.2版本還是可以創造磅礡空間感

WD v1.2版本還是可以創造磅礡空間感

沿用之前試出的電影海報prompt,效果依然讚

沿用之前試出的電影海報prompt,效果依然讚


問題是二次元人物往往凸顯眼睛並淡化其他五官,若用真人圖像 image to image,學習動漫畫圖像資料的 WD v1.2 模型放大眼睛的傾向會比 SD 模型明顯,但結構受限於原圖真人,成為一個身體比例像真人、眼睛又不自然放大的怪東西,如果臉佔畫面比例太小,反而比用 SD 模型圖生圖更接近恐怖谷底。

把這張圖人物按比例縮小,但眼睛保持原本大小...差不多就是i2i產出的失敗品長相

把這張圖人物按比例縮小,但眼睛保持原本大小...差不多就是i2i產出的失敗品長相


幸好 WD v1.3 迅速推出,上述 v1.2 碰到的問題在新版本中已有改善,我另外嘗試以二次元人物圖進行圖生圖,將原圖人物替換為提示詞人物,老問題 ControlNet 還沒出現完全只能碰運氣。不過此時 WD 已非吳下阿蒙,靠敘述生成二次元角色更方便。

尤其東方project角色大都打名字便可出現,特徵敘述則為穩定產出品質

尤其東方project角色大都打名字便可出現,特徵敘述則為穩定產出品質

但我老想把角色塞進繁複背景中,結果便是人物與環境畫風不一樣啊~

但我老想把角色塞進繁複背景中,結果便是人物與環境畫風不一樣啊~

如此一來,AI將有辦法生成"塞入特定角色的海報"

如此一來,AI將有辦法生成"塞入特定角色的海報"

儘管隨著圖內元素越多,角色也越容易失真

儘管隨著圖內元素越多,角色也越容易失真

但我們得相信人類睿智的聯想能力啊!

但我們得相信人類睿智的聯想能力啊!


AI 生成是個令人又愛又恨的主題,心中存在美好的創作自由想像,眼前所見盡是無法忽視的缺陷挑戰,即便這系列文章才寫到 2022 年 10 月初,接下來兩年日子裡情緒如潮水漲落,必須時時叩問動機、調整方向,沉沒成本才不會白費,因為非相關領域人士的我,沒心力也沒必要 AI 生成圖像、文字、影像、音樂一把抓,但願眾裡尋找千百度的、尚未明朗真面目的"它",



依然站在燈火闌珊處,只待我驀然回首。


avatar-img
3會員
25內容數
記錄我在 2022 年 9 月之後使用 AI 生成圖像的嘗試。 這個主題總有一天會沒東西好寫,那就走一步算一步吧...…
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Bsh的沙龍 的其他內容
我以為之前用 Dream Studio 產的圖沒有存,卻意外找到檔案啦? 儘管只有一點點,還是以此為題補一下當時嘗試線上產圖的印象。
至目前為止寫了 3 篇文章都有個共同點 : 未著墨如何用 AI 生成人物圖像。因為那段時間大量使用文生圖試錯,各種歪七扭八的偽人圖片已經品鑑得夠多了,再試下去簡直是在玩偽人版的請出示證件。
即使文生圖功能不完美,Stable Diffusion還有圖生圖功能尚可一戰(?)
安裝 SD 後一週,總算調整成一張 512x768 的圖跑一分鐘同時做自己的事不卡頓,能跑的功能依然有限。但這只是挑戰開端......
整個月嘗試了 SD 模型各種線上產圖服務,但線上工具能做的調整不多,必須生成較多圖片、逐步趨近心中想法。時間就是金錢,所以訂閱線上工具就是雙倍砸錢。
已不記得 Stable Diffusion 於 2022/8/22 發布後,我何時看到相關報導,但我確實從那年 9 月開始留意 AI 生成圖像的網路資訊。 先從 WOMBO Dream 開始......
我以為之前用 Dream Studio 產的圖沒有存,卻意外找到檔案啦? 儘管只有一點點,還是以此為題補一下當時嘗試線上產圖的印象。
至目前為止寫了 3 篇文章都有個共同點 : 未著墨如何用 AI 生成人物圖像。因為那段時間大量使用文生圖試錯,各種歪七扭八的偽人圖片已經品鑑得夠多了,再試下去簡直是在玩偽人版的請出示證件。
即使文生圖功能不完美,Stable Diffusion還有圖生圖功能尚可一戰(?)
安裝 SD 後一週,總算調整成一張 512x768 的圖跑一分鐘同時做自己的事不卡頓,能跑的功能依然有限。但這只是挑戰開端......
整個月嘗試了 SD 模型各種線上產圖服務,但線上工具能做的調整不多,必須生成較多圖片、逐步趨近心中想法。時間就是金錢,所以訂閱線上工具就是雙倍砸錢。
已不記得 Stable Diffusion 於 2022/8/22 發布後,我何時看到相關報導,但我確實從那年 9 月開始留意 AI 生成圖像的網路資訊。 先從 WOMBO Dream 開始......
本篇參與的主題活動
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
最近玩到了一個我覺得很新奇有趣的軟體,叫做SillyTavern。 SillyTavern是專用於創建虛擬角色的AI聊天軟體,SillyTavern是TavernAI的分支,但SillyTavern走上了自己的路,加進了許多額外功能,並且仍在積極的持續更新中。 然後,可以色色!
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
最近玩到了一個我覺得很新奇有趣的軟體,叫做SillyTavern。 SillyTavern是專用於創建虛擬角色的AI聊天軟體,SillyTavern是TavernAI的分支,但SillyTavern走上了自己的路,加進了許多額外功能,並且仍在積極的持續更新中。 然後,可以色色!
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
研究AI生成美女圖像 研究AI生成美女圖像是一個很有趣的方向,特別是對於喜歡速寫但很少畫美女的我來說。AI生成圖像的技術不僅可以幫助創作出我心中所想的形象,還可以作為靈感的來源,讓我在速寫中嘗試新的風格和主題。 基於大量的數據訓練 AI生成的圖像通常基於大量的數據訓練,可以創造出各種不同風格和
Thumbnail
AI生成圖片是一個挑戰性的任務,雖然AI能理解文字需求,但仍無法完全想像心中的理想畫面。使用中文描述AI的生成效果約為5成到6成,而加入擬人化的描述可以讓AI更好地理解需求。無論如何,AI生成圖片仍面臨許多挑戰,需要更多的研究與嘗試。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
AI 繪圖的浪潮席捲而來,如何在沒有靈感時使用聊天機器人找到靈感?此篇分享如何透過ChatGPT來尋求AI幫助生成創意點子,並分享了實例、圖像生成和創作過程。
Thumbnail
  前言:本篇文寫於2022年九月。AI繪圖橫空出世,衝擊大量美術行業,人心惶惶。記得寫作時是我半夜起來尿尿,一時興起就寫下了自己的看法,結果被大量分享出去,大約有800多分享,最有印象的是圖文作家茶里也轉傳。
Thumbnail
最近AI圖和文章盛行,並沒有說這樣不好,現在也有AI圖和AI文比賽,聽人說有個攝影師用他拍的照片去參加AI圖比賽,結果被發現後退賽,我感到悲哀的是用AI去生成的作品還說是自己寫或畫的,尤其是免費的,設定收費的可能是想賺錢,那免費的又說是自己寫和畫是為什麼呢?滿足自己虛榮心嗎? 最近網路上也看到
Thumbnail
生成式AI工具即將邁入三年,除了ChatGPT以外,也進化了許多GenAI工具,如Sora影片生成等。 你知道Stable Diffusion嗎? 從詠唱魔法師Prompts的玩家或職務,AI浪潮持續推進下,SD-WebUI並沒有停滯或被淘汰。 結果告訴了我們一件事情...
Thumbnail
我很少用AI程式來設計擬真人像, 因為失敗率真的太高。
Thumbnail
話說AI生成的確能省掉很多製作費用,但精準度還沒那麼高,除非你願意每月課金訓練。這篇就來分享近半年的協作過程心得。
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
研究AI生成美女圖像 研究AI生成美女圖像是一個很有趣的方向,特別是對於喜歡速寫但很少畫美女的我來說。AI生成圖像的技術不僅可以幫助創作出我心中所想的形象,還可以作為靈感的來源,讓我在速寫中嘗試新的風格和主題。 基於大量的數據訓練 AI生成的圖像通常基於大量的數據訓練,可以創造出各種不同風格和
Thumbnail
AI生成圖片是一個挑戰性的任務,雖然AI能理解文字需求,但仍無法完全想像心中的理想畫面。使用中文描述AI的生成效果約為5成到6成,而加入擬人化的描述可以讓AI更好地理解需求。無論如何,AI生成圖片仍面臨許多挑戰,需要更多的研究與嘗試。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
AI 繪圖的浪潮席捲而來,如何在沒有靈感時使用聊天機器人找到靈感?此篇分享如何透過ChatGPT來尋求AI幫助生成創意點子,並分享了實例、圖像生成和創作過程。
Thumbnail
  前言:本篇文寫於2022年九月。AI繪圖橫空出世,衝擊大量美術行業,人心惶惶。記得寫作時是我半夜起來尿尿,一時興起就寫下了自己的看法,結果被大量分享出去,大約有800多分享,最有印象的是圖文作家茶里也轉傳。
Thumbnail
最近AI圖和文章盛行,並沒有說這樣不好,現在也有AI圖和AI文比賽,聽人說有個攝影師用他拍的照片去參加AI圖比賽,結果被發現後退賽,我感到悲哀的是用AI去生成的作品還說是自己寫或畫的,尤其是免費的,設定收費的可能是想賺錢,那免費的又說是自己寫和畫是為什麼呢?滿足自己虛榮心嗎? 最近網路上也看到
Thumbnail
生成式AI工具即將邁入三年,除了ChatGPT以外,也進化了許多GenAI工具,如Sora影片生成等。 你知道Stable Diffusion嗎? 從詠唱魔法師Prompts的玩家或職務,AI浪潮持續推進下,SD-WebUI並沒有停滯或被淘汰。 結果告訴了我們一件事情...
Thumbnail
我很少用AI程式來設計擬真人像, 因為失敗率真的太高。
Thumbnail
話說AI生成的確能省掉很多製作費用,但精準度還沒那麼高,除非你願意每月課金訓練。這篇就來分享近半年的協作過程心得。