Bad Artist、EasyNegative,這些是什麼? - Stable Diffusion

更新於 發佈於 閱讀時間約 12 分鐘

僅以藝術創作者的角度,詮釋我對Stable Diffusion的理解。
使用AUTOMATIC 1111 WebUI介面。

Textual Inversion embedding

  玩過Stable Diffusion(下以SD略稱之),並且有前往CIVITAI等網站下載其他人訓練的AI模型的玩家,應該會注意到在範例圖中提供的設定,其-Prompts(負提示)內常常出現「Bad-Hands」、「EasyNegative」、「Bad-Artist」等關鍵字。

  最初我以為SD這麼厲害,只要在-Prompts輸入這些字詞就知道不可以畫出「很醜的手」、不要模仿「不好的繪師」--但EasyNegative呢?而且就算輸入了,還是會出現很糟糕的手啊?

  其實上述這些都是指向「Textual Inversion embedding」的關鍵字(下以「TIE」略稱之)。英文程度還不錯的人若有興趣,可閱讀AUTOMATIC1111 WebUI作者在GitHub網站的TIE解說頁面。另外,本文後續會用到在該頁面下載的Pekora/佩克拉的TIE

嗯?你不知道Pekora長什麼樣子?大概像這樣:

raw-image


至於我自己的理解如下:

TIE是一種定義提示字詞的「微」模型。詞嵌入」維基百科

  也就是說,不同於Dreambooth、LoRA、Hypernetwork等會實際更動算圖流程的模型,TIE是告訴SD「它代表的涵義是什麼」。

Dreambooth:教導既存大模型新的概念、改變了既存大模型 = 創造了新的大模型。可以想像為老師教學生學會新的畫風、新的內容,但這個過程有可能讓學生「忘記」或「重新解讀」先前學會的其他概念

LoRA/Hypernetwork:在既存大模型的繪圖過程中插入額外步驟,引導大模型算出想要的結果。可以想像為老師在學生繪圖的過程中分階段介入修圖,藉此畫出想要的畫風和內容,而不會永久性地改變學生的已知概念(不會改變大模型)。只要老師不在(不使用LoRA/Hypernetwork模型),學生就不知道該怎麼畫。

TIE:定義提示字詞對SD所代表的涵義。可以想像為老師催眠學生:「XXX的意思就是這種畫風、這種形狀、這種顏色」,而當催眠解除(移除TIE時),學生就會忘記該字詞的涵義,同樣不會永久性地改變學生的已知概念

  Dreambook、LoRA/Hypernetwork的基本原理應該不難懂,但TIE的原理讀者可能會覺得「這怎麼可行」對吧?其實這和SD算圖的原理有關:將字詞代表的涵義擴散(Diffuse)到畫素上,所以TIE的原理就是告訴模型「你要用特定的方法擴散才能滿足這個字詞的定義」。

例如:柯基犬TIE:「你這樣擴散就能畫出柯基犬。」--但AI並不知道柯基犬長什麼樣。

  但也是因為TIE的原理太「籠統」,所以訓練出的結果往往沒有其他方法要來得「精準」。

*英文聽力不錯的人,推薦這部以通俗方式講解上述四種訓練模型原理的影片


TIE為何會用在-Prompts?

  因為TIE是「微」模型,大小以KB為單位卻能顯著影響繪圖成果,而且-Prompts原本就常包含定義很籠統的字詞,所以有些高手就花費時間訓練出「大多情況不想要在成果中出現」的TIE提供大家使用。那麼,接下來就準備上圖了:

SD設定:

chilloutmix_Ni / salutemix_v1
512x512
CFG Scale 10
Sampling steps 30
Seeds 3120725476 / 2308425211
Batch size 4
*Sampling method我忘了記錄,但應是Heun--至少文末的大圖是。

+Prompts

masterpiece, 1girl, 30 years old, noble, holding a scepter, interior, european castle, Middle Ages, portrait,

-Prompts

(low quality, worst quality:1.4), (monochrome:1.1), (greyscale), watermark, text, blurry, jpeg artifacts, cropped, normal quality, signature, username, artist name, cartoon, canvas frame, lowres, (disfigured), (bad art), (deformed), (extra limbs), (b&w), weird colors, (duplicate), (morbid), (mutilated), mutated hands, (poorly drawn hands), (poorly drawn face), (mutation), (ugly),  (bad proportions), cloned face, out of frame, gross proportions, (malformed limbs), (missing arms), (missing legs), (extra arms), (extra legs), fused fingers, (long neck), lowres, (grayscale), (skin spots), acnes, skin blemishes, (age spot),

  +/- Prompts會各別額外加入下列的TIE,請參考各圖片說明:

bad-hand-5

bad-artist

bad_prompt_version2

EasyNegative
(*下載的TIE .py或.safetensor檔,請放到webuiembeddings資料夾內)

1. chilloutmix_Ni大模組系列(3120725476):

raw-image
raw-image
raw-image
raw-image
raw-image
raw-image

看到這的讀者,應該對bad_promts_version2很有意見,不過請先容我先接著貼--

2. salutemix_v1大模型(3120725476)的圖:

raw-image
raw-image
raw-image
raw-image
raw-image
raw-image

  現在是不是很霧煞煞,理應減少不良成果的bad_prompt_version2,以及把Pekora TIE放在-Prompts時--

怎麼產出的圖比不放它們要來得差?

  我也很好奇,於是決定把上述四種用在-Prompts的TIE全都放在+Prompts跑了一遍(salutemix_v1、2308425211),問題根源就很明顯了:

raw-image
raw-image

bad-hand-5:
除了理應包含的「奇怪手部」,也包含了「女孩臉型/體型」、「鳳眼/東亞臉型」、「東亞傳統服裝」、「柔和無描線的畫風」等。

raw-image

bad-artist:
除了「畫布畫框」、「難看的透明度點」、「過度曝光」、「文字」等確實常常不想要的內容外,也包含了類似「女孩臉型/體型」、「鳳眼/東亞臉型」、「東亞傳統服裝」、「柔和無描線的畫風」等。

*bad-hand-5、bad-artist包含的內容有高度相似之處,但查了一下並非同位作者。

raw-image

bad_prompt_version2:
包含了確實是大多數人不想要的內容,但「魔鬼藏在細節裡」,對照-Prompts的測試結果可推知,「瓜子臉/比較尖瘦的臉型」、「尖挺的鼻子」、「豐潤的嘴唇」、「有立體感的光影」等,竟也都算在了裡面!
--所以-Prompts的測試才會出現預期外的扁平臉!

raw-image

EasyNegative:
包含了「單色背景」、「漸層背景」、「單調背景」、「書頁曲面般的背景」、「過黑」、「過暗」、「單調陰影」等,但會發現有「大小眼」的問題(在上圖右上人物,以及chilloutmix_Ni -Prompts EasyNegative左下人物較明顯,並且用在-Prompts時,較大的眼睛會從左眼變右眼)。

raw-image

最後用Pekora壓壓驚:
但可以發現,Pekora的TIE把「強調上睫毛」、「黑色緊身衣/胸罩」和「胸形突出」等也算了進去,所以放在-Prompts時會有「上睫毛不明顯」、「變成超級平胸」且「排除黑色底的衣服」等現象。而放在+Prompts時,更能明顯注意到「強烈更改了畫風」。



總結:TIE會反應出作者和圖源中有意無意的偏見

  其實不只TIE,我想所有的AI模型都有上述問題,不過因為SD是繪圖AI,而繪圖本身就是反映作者偏好的過程,所以單就這點而言其實問題不大。然而,本文所測試用於-Prompts的TIE,原本的用意是排除一些常見的不想要的錯誤,卻每一種都會額外影響到其他的層面,而這些層面卻可能是使用者不想排除的部分

  也因此,做完這篇文章的測試並和「無TIE」版本做了比較後,我決定只留下bad-hands-5的TIE,其他則寧可使用更多的字詞來包含我不想要的內容,如下:

bad-hands-5, (low quality, worst quality:1.4), (monochrome:1.1), (greyscale), watermark, text, blurry, jpeg artifacts, cropped, normal quality, signature, username, artist name, cartoon, canvas frame, lowres, (disfigured), (bad art), (deformed), (extra limbs), (b&w), weird colors, (duplicate), (morbid), (mutilated), mutated hands, (poorly drawn hands), (poorly drawn face), (mutation), (ugly),  (bad proportions), cloned face, out of frame, gross proportions, (malformed limbs), (missing arms), (missing legs), (extra arms), (extra legs), fused fingers, (long neck), lowres, (grayscale), (skin spots), acnes, skin blemishes, (age spot),

最後,就以+Prompts加入Pekora TIE,-Prompts中使用bad-hand-5 TIE的圖片來收尾吧!

raw-image

  下次想聊聊紫色斑塊與VAEs。


留言
avatar-img
留言分享你的想法!
avatar-img
︾黑米BR的沙龍︽
82會員
105內容數
筆者探索各種感興趣事物的紀錄。 *副帳非主流政治沙龍《黑米BR不政確》:https://vocus.cc/user/@BRriceP
2023/11/01
筆者最近開啟連載的小說《M.O.N》是以AI、仿生人、安寧療護為主軸的科幻短篇。書封,按照慣例,是自製;也按照慣例,使用了Stable Diffusion (SD)。
Thumbnail
2023/11/01
筆者最近開啟連載的小說《M.O.N》是以AI、仿生人、安寧療護為主軸的科幻短篇。書封,按照慣例,是自製;也按照慣例,使用了Stable Diffusion (SD)。
Thumbnail
2023/10/04
實際上,筆者的Stable Diffusion (Vlad)依舊有些問題,仍不曉得原因是顯卡、Win11、SSD、Vlad或其他,但會先從更新顯卡驅動和重裝Vlad開始找錯。 現況是Vlad運算了二三張圖後就會因為GPU記憶體不夠的問題開始極度緩慢,因此打擊了我創圖的意願。 另一方面,也是對創作
Thumbnail
2023/10/04
實際上,筆者的Stable Diffusion (Vlad)依舊有些問題,仍不曉得原因是顯卡、Win11、SSD、Vlad或其他,但會先從更新顯卡驅動和重裝Vlad開始找錯。 現況是Vlad運算了二三張圖後就會因為GPU記憶體不夠的問題開始極度緩慢,因此打擊了我創圖的意願。 另一方面,也是對創作
Thumbnail
2023/09/20
想著有一陣子沒碰SD,就生成了一張繪圖來致敬。
Thumbnail
2023/09/20
想著有一陣子沒碰SD,就生成了一張繪圖來致敬。
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
Midjourney MidJourney 是一個 AI 繪圖產生工具,可根據使用者透過描述,利用文字描述風格、題材、場景等關鍵字,就能透過 AI 快速產生對應的視覺作品。 DALL·E 2 DALL·E 2 是由 OpenAI 開發的 AI 圖像產生器,根據文本描述創建圖像和藝術形式。它展示了擴
Thumbnail
Midjourney MidJourney 是一個 AI 繪圖產生工具,可根據使用者透過描述,利用文字描述風格、題材、場景等關鍵字,就能透過 AI 快速產生對應的視覺作品。 DALL·E 2 DALL·E 2 是由 OpenAI 開發的 AI 圖像產生器,根據文本描述創建圖像和藝術形式。它展示了擴
Thumbnail
本篇要來分享一下製作 (漫畫)姊妹會秘儀時用到的各種AI生成技巧。 很多時候,為了將心中一個想法實現,必須用上許多自己原先不會的技巧,雖然過程是痛苦的、掙扎的,但是這樣一點一滴邁向終點,當到達時,就會發現收穫的不只是成果,還有一路上學到的新技能。
Thumbnail
本篇要來分享一下製作 (漫畫)姊妹會秘儀時用到的各種AI生成技巧。 很多時候,為了將心中一個想法實現,必須用上許多自己原先不會的技巧,雖然過程是痛苦的、掙扎的,但是這樣一點一滴邁向終點,當到達時,就會發現收穫的不只是成果,還有一路上學到的新技能。
Thumbnail
本文探討了反向詞(Negative Embedding)的概念,並介紹了在 Stable Diffusion WebUI 中使用的幾種模型,包括 EasyNegative、bad_prompt_version2、bad-hands-5 和 Deep Negative V1.x。這些模型的主要目的是在
Thumbnail
本文探討了反向詞(Negative Embedding)的概念,並介紹了在 Stable Diffusion WebUI 中使用的幾種模型,包括 EasyNegative、bad_prompt_version2、bad-hands-5 和 Deep Negative V1.x。這些模型的主要目的是在
Thumbnail
這篇要來談談一個我最近常用的大量生圖方法 -- 狂野生圖法。
Thumbnail
這篇要來談談一個我最近常用的大量生圖方法 -- 狂野生圖法。
Thumbnail
我們今天這一篇文章,要分享我自己玩AI繪圖到目前為止的心得並且把影響AI繪圖品質歸類為四大要素,我將以實證並且實測的角度來驗證給各位看,到底這幾個要素會怎樣影響我們產生的AI繪圖的品質,跟我一樣好奇或者是AI的繪圖新手們應該可以從今天的文章中掌握到如何提升圖片品質的技巧。
Thumbnail
我們今天這一篇文章,要分享我自己玩AI繪圖到目前為止的心得並且把影響AI繪圖品質歸類為四大要素,我將以實證並且實測的角度來驗證給各位看,到底這幾個要素會怎樣影響我們產生的AI繪圖的品質,跟我一樣好奇或者是AI的繪圖新手們應該可以從今天的文章中掌握到如何提升圖片品質的技巧。
Thumbnail
「吾生也有涯,而知也無涯。以有涯隨無涯,殆已。」 AI 每天都在進步,如果你每樣都要跟,鐵定是跟不上的;如果放棄不跟,那又勢必被淘汰。也有的人自以為聰明,想說要讓AI進化到"完成體"再跟,那更是謬之大矣。要知道任何的知識技能都有學習曲線,你一定得要有先備的基礎知識(Pre-trained?),才能學
Thumbnail
「吾生也有涯,而知也無涯。以有涯隨無涯,殆已。」 AI 每天都在進步,如果你每樣都要跟,鐵定是跟不上的;如果放棄不跟,那又勢必被淘汰。也有的人自以為聰明,想說要讓AI進化到"完成體"再跟,那更是謬之大矣。要知道任何的知識技能都有學習曲線,你一定得要有先備的基礎知識(Pre-trained?),才能學
Thumbnail
整整一個月前,我開始接觸AI繪圖,它帶給我的震撼,開啟了我一個月的追尋之旅。
Thumbnail
整整一個月前,我開始接觸AI繪圖,它帶給我的震撼,開啟了我一個月的追尋之旅。
Thumbnail
Textual Inversion embedding   玩過Stable Diffusion(下以SD略稱之),並且有前往CIVITAI等網站下載其他人訓練的AI模型的玩家......
Thumbnail
Textual Inversion embedding   玩過Stable Diffusion(下以SD略稱之),並且有前往CIVITAI等網站下載其他人訓練的AI模型的玩家......
Thumbnail
今天分享一個比較簡單的提示詞訣竅。善用模組作者的正負面提示詞。
Thumbnail
今天分享一個比較簡單的提示詞訣竅。善用模組作者的正負面提示詞。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News