就把光暗分開了。【2023/1~2】

更新於 發佈於 閱讀時間約 4 分鐘

2023 年 1-2 月之間,開始陸續有感興趣的角色 LoRA 上傳 Civitai 網站,同期間出現幾個有名的模型,例如能畫亞洲面孔的真人模型 Chilloutmix、二次元揉合厚塗的 OrangeMix 系列模型等等......


有種脫歐入亞的感覺啊,還是熟悉的風格比較好評價。


但看得懂和會不會用是兩回事,將真實模型合併二次元模型後, OrangeMix 系列帶來更真實的人體以及更柔和的光影表現,以至於我這幾個月摸索出來、表現較穩定的場景 prompt,用新模型產圖效果就不一樣了。


例如 12 月發現,能穩定營造下班時刻現代月台風格的提示詞:

raw-image


放在 Novelai 模型上:

raw-image


放在 waifu diffusion-1.4 模型上:

raw-image


這提示詞產出的背景風格都比主要人物穩定,顯得我的 AI 圖像生成研究根本誤入歧途,社群上大家想看的是妹子、不是柱子啊 ! 因此看到 OrangeMix 系列模型被介紹可以提供更好人體形貌,便迫不及待下載嘗試。當我把這穩定的提示詞丟進去:




raw-image

欸不是,我知道工作是黑白的,但不用這麼直接吧


和示意圖上鮮豔光影相差甚遠,我原以為因為提示詞強調的現代風格,導致 AI 過於加強日光燈的白光,但即便換其他幾組、在別的模型上能穩定產出特定場景的提示詞,OrangeMix 系列模型出來的圖片仍舊彩度過低,作者當初融合模型時該不會融到水墨畫模型了吧 ?


於是我上網查資料尋求解答,這才發現要搭配特定 VAE 檔案,讓圖片保持艷麗。


自 Stable Diffusion 推出後,天下使用者苦 Diffusion 模型好像比 GAN 模型有可控性,結果實際操作結果根本不能反映腦中想法久矣。所以 2022/9/25 由 Victor Gallego 發表的美學梯度 (Aesthetic Gradients),在 Embedding、LoRA 等方法應用於此前處理這種問題。


美學梯度使用了生成對抗網路,讓模型產圖的過程中,透過兩組神經網絡互相競爭,使生成的圖像在保持原本架構下,又融入了資料集的美術風格。簡單來說就是當你在廚房煮東西時,一位造詣精深的師傅在旁邊隨時給回饋,引導你煮出來名菜而不是黑暗料理。但哪會如此簡單就能學會煮名菜,人類對話往往是這樣...


「阿瑋你又在玩電動喔 ? 休息一下吧,去看個書好不好 ?」


「煩耶。」


「我在跟你講話你有沒有聽到 ?」

「我才講你兩句,你就說我煩 ? 」

「我只希望你能夠好好用功讀書,整天只看到你在這邊打電動......」


「吼 死了啦 都你害的啦」



AI 當然不會杰哥不要,但美學梯度用兩組神經網絡進行監督式學習,提供給負責監督模型的資料集需要風格一致才能進行有效引導,否則就像阿瑋阿嬤在旁邊教阿瑋用功不教阿瑋怎麼打電動,然後他就死掉了。


而 VAE (變分自動編碼器) 則是早在 2013/12/20 便由 Diederik P Kingma 和 Max Welling 提出,因為以 Diffusion 模型生成圖片時,像素越多計算量越龐大,因此需要【壓縮-計算-解壓縮】的流程降低計算需求並產出人們能看見的圖像。VAE 負責解壓縮的部分,所以不同 VAE 解壓縮過程中,會為圖片帶來一點細節、色調的不同小影響。回歸前面煮菜譬喻,差不多類似調理包,自己不會煮沒差,調理包倒下去照樣變成名菜。


OrangeMix 系列模型黯淡的原因昭然若揭,因為我沒搭配對應的 VAE。


當我補上,再度出圖,讓我想起了那段話 :








"神說,要有光。"

raw-image
留言
avatar-img
留言分享你的想法!
avatar-img
Bsh的沙龍
3會員
49內容數
記錄我在 2022 年 9 月之後使用 AI 生成圖像的嘗試。 這個主題總有一天會沒東西好寫,那就走一步算一步吧...…
Bsh的沙龍的其他內容
2025/04/22
或許舊作品消滅與 AI 生成風潮,只是證實內心對圖像價值的質疑。諷刺的是,我竟因為懶得開 SD 、漫無目的上網而看到新的可能性。
Thumbnail
2025/04/22
或許舊作品消滅與 AI 生成風潮,只是證實內心對圖像價值的質疑。諷刺的是,我竟因為懶得開 SD 、漫無目的上網而看到新的可能性。
Thumbnail
2025/04/15
測過 ChatGPT 寫提示的效果,我再無懸念,自己目前的流程問題開張 Google sheet 便能解決,用不著 AI。
Thumbnail
2025/04/15
測過 ChatGPT 寫提示的效果,我再無懸念,自己目前的流程問題開張 Google sheet 便能解決,用不著 AI。
Thumbnail
2025/04/11
追根究底,如何確認提示詞在圖裡確實有發揮作用?問問 DAAM
Thumbnail
2025/04/11
追根究底,如何確認提示詞在圖裡確實有發揮作用?問問 DAAM
Thumbnail
看更多
你可能也想看
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
2023 年 1-2 月,Civitai 網站出現幾個有名的模型,例如能畫亞洲面孔的真人模型 Chilloutmix、二次元揉合厚塗的 OrangeMix 系列模型等等...... 有種脫歐入亞的感覺啊。
Thumbnail
2023 年 1-2 月,Civitai 網站出現幾個有名的模型,例如能畫亞洲面孔的真人模型 Chilloutmix、二次元揉合厚塗的 OrangeMix 系列模型等等...... 有種脫歐入亞的感覺啊。
Thumbnail
Civitai 提供整合性平台、LoRA 開放大家參與,探尋選項變多帶來倍增的可能性,我卻發現此刻的 Civitai ,以西洋風格角色/風格為大宗,日式風格的角色範例圖片則有點...
Thumbnail
Civitai 提供整合性平台、LoRA 開放大家參與,探尋選項變多帶來倍增的可能性,我卻發現此刻的 Civitai ,以西洋風格角色/風格為大宗,日式風格的角色範例圖片則有點...
Thumbnail
自 NovelAI 模型外洩後,技術人士分析該模型如何在二次元風格表現優異、普通愛好者則將目光鎖定在 Danbooru tag 庫上,是為大 prompt 時代。
Thumbnail
自 NovelAI 模型外洩後,技術人士分析該模型如何在二次元風格表現優異、普通愛好者則將目光鎖定在 Danbooru tag 庫上,是為大 prompt 時代。
Thumbnail
從去年火到現在,相信大家對於 AI 繪圖都不陌生,一夕之間,好像大家都成為藝術家了。 但,看著一張張圖產出了過程,我突然覺得好像少了點什麼? 於是,開始用 AI 來創作諷刺時代的梗圖 於是,開始用 AI 來創造和衝突的和諧 於是,開始用 AI 來幫北極熊發聲
Thumbnail
從去年火到現在,相信大家對於 AI 繪圖都不陌生,一夕之間,好像大家都成為藝術家了。 但,看著一張張圖產出了過程,我突然覺得好像少了點什麼? 於是,開始用 AI 來創作諷刺時代的梗圖 於是,開始用 AI 來創造和衝突的和諧 於是,開始用 AI 來幫北極熊發聲
Thumbnail
因為最近在玩這篇ACG LoRA的寫實風運用 - Stable Diffusion 心得中的內容,所以繼約兒後也嘗試了2B的LoRA。
Thumbnail
因為最近在玩這篇ACG LoRA的寫實風運用 - Stable Diffusion 心得中的內容,所以繼約兒後也嘗試了2B的LoRA。
Thumbnail
隨著 AIGC 的深入發展,AI 加速滲透到了各個行業領域的內容生產中。 從內容審核、智能營銷、個性化推薦,到影視劇“換臉”、虛擬主播、自動配音等多種場景,無不充斥著 AI 的身影。 在這樣的背景下,各行各業都開始關注 AI 生成是否會對行業造成衝擊、會不會取代藝術家、設計師等問題。 最近掀起了一股
Thumbnail
隨著 AIGC 的深入發展,AI 加速滲透到了各個行業領域的內容生產中。 從內容審核、智能營銷、個性化推薦,到影視劇“換臉”、虛擬主播、自動配音等多種場景,無不充斥著 AI 的身影。 在這樣的背景下,各行各業都開始關注 AI 生成是否會對行業造成衝擊、會不會取代藝術家、設計師等問題。 最近掀起了一股
Thumbnail
宇宙來臨,數字人和AI 時代的來了,這將改變人類的生活習慣 請來了一位外國女性來當模特,真的辛苦站一整天,還沒工資... _模特 由Blender 建模及渲染,然後IK 骨骼綁定臉部,這樣就可以作臉部表情(由於目前是靜態拍照可以省略..) _ 光源: 夜晚HDRI為環境光源照亮大地,這樣就
Thumbnail
宇宙來臨,數字人和AI 時代的來了,這將改變人類的生活習慣 請來了一位外國女性來當模特,真的辛苦站一整天,還沒工資... _模特 由Blender 建模及渲染,然後IK 骨骼綁定臉部,這樣就可以作臉部表情(由於目前是靜態拍照可以省略..) _ 光源: 夜晚HDRI為環境光源照亮大地,這樣就
Thumbnail
AI繪圖的議題 1.Mid journey 目前還是領頭羊: 在於人像繪製上,多數 AI 都很難畫的細緻入微,但 Midiourney 畫家們卻不斷地打破這個限制,有興趣的朋友可以加入它們的社群。 2.圖片的隱私問題: 我們的面貌被對方公司拿去使用了,這也是為什麼公司願意提供免費 beta 版本,數
Thumbnail
AI繪圖的議題 1.Mid journey 目前還是領頭羊: 在於人像繪製上,多數 AI 都很難畫的細緻入微,但 Midiourney 畫家們卻不斷地打破這個限制,有興趣的朋友可以加入它們的社群。 2.圖片的隱私問題: 我們的面貌被對方公司拿去使用了,這也是為什麼公司願意提供免費 beta 版本,數
Thumbnail
2022 與祢畫話 /161/阿德 心系列 20220309 領受:景境 主題: 鏡景 世界一直在變動 沒有人知道未來會發生什麼事情? 是否你的心被影響呢 我們需要平安安穩 深呼吸 吐口氣 心如止水 我們都需要平安 平安 #喜歡歡迎追蹤 #不喜歡滑過去就好 #畫話福音 #你的畫風就是你的畫風
Thumbnail
2022 與祢畫話 /161/阿德 心系列 20220309 領受:景境 主題: 鏡景 世界一直在變動 沒有人知道未來會發生什麼事情? 是否你的心被影響呢 我們需要平安安穩 深呼吸 吐口氣 心如止水 我們都需要平安 平安 #喜歡歡迎追蹤 #不喜歡滑過去就好 #畫話福音 #你的畫風就是你的畫風
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News