Stable Diffusion基礎 -- 圖生圖（img2img）

子不語

發佈於學習AI繪圖

2023/06/01 更新2023/05/31 發佈閱讀 6 分鐘

前言

這一篇要來敘述Stable Diffusion的Automatic1111的圖生圖（img2img，簡稱i2i）功能。

在圖生圖的頁面上，大部分的功能跟文生圖的功能一樣，請直接查閱 Stable Diffusion基礎 -- 文生圖（txt2img），這邊就不復述了。這邊來討論不一樣的功能：

這邊最重要的功能是1（圖片放置區）跟4（Denoising strength）。我們之後會常常用到。

功能分區

圖片放置區：這個區域我們有三個重要的次要區域在這邊，
第一個是分頁標籤，裡面有圖生圖（img2img），塗鴉（sketch），局部修改（inpaint）等等，我們這邊主要聚焦於圖生圖這功能。
第二區是圖片放置區，在這裡我們可以用拖曳或者點擊打開檔案選擇器，把自己要修改的圖放入。
第三區是拷貝圖片到其他區域，在這邊我們可以把同一張圖自由切換到不同功能去，例如你用img2img載入圖片，突然發現其實你要的只是局部修改某個區域，就可以直接按Copy image to Inpaint把圖直接送進inpaint分頁來修改。
尺寸變動選項：當你的輸出尺寸設定與原先圖片尺寸不一致時，Automatic1111就會依照這邊選取的選項來調整畫面：
Just resize：無視比例，直接把圖片縮放成目標尺寸（原圖內容無損失，但比例可能扭曲）。
Crop and resize：依照目標尺寸的比例，先把多餘的內容都去除掉再縮放到目標尺寸（會損失原圖的內容）。
Resize and fill：依照目標尺寸的比例，在不足的地方填充雜訊，然後縮放到目標尺寸，接下來靠img2img來把雜訊轉換成有意義的內容（會增加原圖的內容）。
Just resize (latent upscale)：與第一個功能Just resize相同，但是Just resize是直接縮放，而這個選項是使用AI放大演算法來縮放圖片，所以需時較久，但是在放大後可能產生比較多的細節（原圖內容無損失，但比例可能扭曲）。
輸出尺寸設定：我們可以在img2img的時候指定成品圖的新尺寸，有兩種方法：
Resize to：直接指定成品圖的長與寬。
Resize by：指定成品圖的放大或縮小倍率，預設是1，也就是不變動。
去躁力度（Denosing strength）：輸出圖片的變動程度。在img2img的第一步，Stable Diffusion會將噪訊加進輸入圖片中，然後依照提示詞的內容來產生圖片。數值越大的話，第一步加入的噪訊就會越多，輸出圖片會差異越大。例如0.1到0.2時，只會在細微的圖樣，陰影產生變化。到了0.4以上，就會對畫面中的小物品產生明顯變化，到了0.6以上會對整張圖的組成產生很明顯的影響，例如人物姿勢與位置，甚至整個構圖都會不一樣。到了1就會產生一個跟輸入圖毫無關聯的圖，其實就等於純粹的文生圖。
除此之外，AI跑新圖的時間也與去噪力度有關，數值越大就會跑越久。當你設定要跑100步，但是去噪力度為0.1時，它實際上只跑了100*0.1=10步。
提示詞提取按鈕：讓使用者可以從輸入圖提取可能的提示詞。Automatic1111提供了兩種不同的演算法來提取提示詞。
Interrogate CLIP：使用OpenAI開發的CLIP演算法來提取提示詞。使用這個方法提取的提示詞使用的是自然英語的語法。由於大部分的網路圖片都是自然英文，而Stable Diffusion使用的是網路圖片以及其敘述來訓練基本模型，所以理論上使用這個方法得到的提示詞在生成真實世界照片時效果較佳。
Interrogate DeepBooru：針對2D動畫的模型，例如Waifu-Diffusion或NovalAI都是從DanBooru這個網站抓圖下來訓練，而這個網站使用的分類標籤系統，就成了DeepBooru這個演算法的基本資料。使用這個方法會提取出以標籤為主的提示詞，以逗號分隔。常用的提示詞如1girl，long hair都是這個提示詞演算法引入的。也因此只有在動漫畫相關的模型裡面，這樣的提示詞才有明顯作用。如果是純粹的Stable Diffusion基本模型，應該沒有自然英文語法來得好用。

下面是一個原版圖片，依照不同的提示詞與0.65的Denoising strength來重繪的比較圖：

參考文件

子不語怪・力・亂・神學習AI繪圖Automatic1111基礎

留言

留言分享你的想法！

子不語怪・力・亂・神

34.5K會員

446內容數

寫奇幻小說，畫圖，心得，各式各樣作品的故鄉。

子不語怪・力・亂・神的其他內容

2023/06/20

Stable Diffusion基礎 -- 安裝ControlNet

本篇要來講解一下身為Automatic1111最重要的外掛ControlNet的安裝方法。

2023/06/20

Stable Diffusion基礎 -- 安裝ControlNet

本篇要來講解一下身為Automatic1111最重要的外掛ControlNet的安裝方法。

2023/06/14

Stable Diffusion基礎 -- 外掛（Extensions）

本篇要來解說Automatic1111這個軟體很重要的一部分，就是外掛（Extension）管理。外掛是Automatic1111之所以超越玩具與學術研究工具，成為有生產力的軟體的關鍵。

2023/06/14

Stable Diffusion基礎 -- 外掛（Extensions）

2023/06/08

Stable Diffusion基礎 -- 塗鴉（Sketch）

本篇要來講述兩個很少用，而且也會讓人很困惑的小功能，塗鴉（Sketch）與局部塗鴉（Inpaint Sketch）。

2023/06/08

Stable Diffusion基礎 -- 塗鴉（Sketch）

本篇要來講述兩個很少用，而且也會讓人很困惑的小功能，塗鴉（Sketch）與局部塗鴉（Inpaint Sketch）。

看更多

你可能也想看

Betty's Jump Diary《貝蒂的跳躍日記》的沙龍

用「香氣」就能測出我的靈魂？Sunkronizo × 3 號香：帶我走進八種人生角色的那一週

試聞 Sunkronizo的香氛後，我才發現：原來不是我在挑香，而是香氣更早知道我是誰。原本以為自己最像溫柔的 1 號，真正試香後卻被成熟、冷靜的 3 號選中。其他七瓶香，也意外喚醒我生命中不同階段的八種角色。香氣讓我明白——人生不只直線前進，也能橫向展開，切換更多樣的自己。

#購物#香水#香水評論

2025/11/28

Betty's Jump Diary《貝蒂的跳躍日記》的沙龍

用「香氣」就能測出我的靈魂？Sunkronizo × 3 號香：帶我走進八種人生角色的那一週

#購物#香水#香水評論

2025/11/28

店小二DianXiaoEr的沙龍

AI繪圖-Stable Diffusion 005- 圖生圖 img2img

在掌握Stable Diffusion文生圖的使用技巧幫助我們利用文字描述的組合/變化去生成所需的圖片內容後，再更進一步，我們也許會想要針對一張已經百分之七、八十符合我們需求的圖去進行部分內容的修改或是整體畫風的轉換。這時就需要有個”圖生圖 img2img”的操作介面讓我們能和SD溝通。

#StableDiffusion#AI繪圖教學#AI繪圖

2023/08/17

店小二DianXiaoEr的沙龍

AI繪圖-Stable Diffusion 005- 圖生圖 img2img

#StableDiffusion#AI繪圖教學#AI繪圖

2023/08/17

酷貓文創工房的沙龍

利用人工智能將照片轉換為手繪效果

玩AI手繪也不錯<Stable Diffusion篇> 在當今數碼時代，照片成為人們記錄生活的重要方式。然而，有時我們渴望將照片轉化為更加藝術性的形式，以獨特的風格呈現。這就是人工智能的力量發揮作用的時候了。利用深度學習和計算機視覺技術，研究人員開發出了一種令人驚嘆的AI技術，可以將照片轉換為手繪效

#人工智能#影像#StableDiffusion

2023/06/21