vocus logo

方格子 vocus

Stable Diffusion -- 訓練LoRA(五)

更新 發佈閱讀 6 分鐘

前言

這篇要來討論,我們是否能靠著一張圖,就能鍛鍊出LoRA。

之前在Youtube上介紹Stable Diffusion很有名的光頭佬Olivio Sarikas發過一個影片,介紹了如何使用一張圖來訓練LoRA:

我原本以為他要教如何從一張圖,生成許多素材圖來烘焙LoRA,但沒想到他是真的只靠一張圖,經過放大分割成二十幾張小圖來訓練LoRA。這樣的訓練法其實也是可行的,但是它只能用在風格、場景型的LoRA,而且對整體風格的干擾非常嚴重,除非是要大量生成類似的場景,要不然用處不大。

那,我們真的能只靠一張圖來生成LoRA需要的訓練素材圖嗎?

根據我在 Stable Diffusion進階 -- ControlNet新功能Reference 做的觀察,理論上只要是Reference能夠參照複製的角色圖,我們就能製作出大量的素材圖來訓練LoRA。而這篇就要來實作驗證。

實驗

這次我想從一個比較模糊的角色圖開始,藉由設定角色的個性與經歷來建立她的外貌特徵,然後開始產生素材圖,用這樣的方式模擬一般角色發想的流程。

這次的實驗從之前的一副圖「姐妹會秘儀」開始,由於這張圖的構圖非常有趣,充滿故事性,畫中的每個人物似乎都有一個可以說的故事,於是我決定把我覺得最有感覺的角色獨立出來製作LoRA:

vocus|新世代的創作平台

在這幅畫之中,這個角色只有一個大略的模糊形象跟衣著特色,如果要製作當成LoRA訓練的素材,解析度必須高,角色的五官特徵必須足夠銳利,否則就會練出一堆爛掉的圖。

所以首先必須將圖局部放大之後再Inpaint,並且用繪圖軟體修掉斑點與太過模糊的細節:

vocus|新世代的創作平台

從這個基礎角色圖,可以歸納出這個角色的外部特徵:

黑髮,高馬尾,深藍色眼睛,柳眉,三十歲以上,嚴肅,兩分瀏海。

接著來使用ControlNet的Reference前處理器來抽取這張基礎圖的特徵,然後透過不斷嘗試不同的提示詞來製作類似的角色:

vocus|新世代的創作平台

經過幾次測試調整,我使用這樣的正面提示詞來引導原始參照圖產生我要的結果:

(masterpiece, top quality, best quality, official art, beautiful and aesthetic:1.2), (1girl:1.2),
35 years old, long ponytail, black hair, victorian dress, red dress, shawl, long sleeves, wide sleeves,
serious face,
extreme detailed, highest detailed, fantasy, dynamic pose, half body portrait

在這串提示詞中,35 years old, long ponytail, black hair, victorian dress, red dress, shawl, long sleeves, wide sleeves限制了角色的外部特徵,serious face限制了角色的表情,dynamic pose保證我可以產出多樣的姿態與攝影機角度,確保LoRA訓練時的素材圖擁有不同角度與光影。下面是幾張產生的訓練圖:

vocus|新世代的創作平台

我使用了大約四十張訓練素材圖,然後使用這幾篇文章的流程來使用Google Colab訓練LoRA:

Stable Diffusion -- 訓練LoRA(一)

Stable Diffusion -- 訓練LoRA(三)

Stable Diffusion -- 訓練LoRA(四)

藉此產生了LoRA。

驗證

我使用X/Y/Z plot來測試在不同的權重,不同的表情在原始模型GhostMix下的表現:

vocus|新世代的創作平台

另外也要確認這個LoRA可以在其他模型,例如擬真系的RealDosMix裡面運作:

vocus|新世代的創作平台

就這樣,我們完成了用一張草圖訓練出LoRA的策略了!

這個方法目前僅適用於能夠用ControlNet的Reference來再現特徵的圖,目前已知擬真系與真實照片不太能用這方法來製造訓練素材,所以目前它只適用於動漫畫人物的訓練。

祝大家AI算圖愉快!


LoRA目錄:

留言
avatar-img
子不語怪・力・亂・神
37.9K會員
455內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
2023/06/26
這篇討論的是LoRA訓練裡面,可能是最重要的一步,就是選圖的標準,以及提示詞的選取策略。 最近在詳細研究到底要如何練出優質穩定的LoRA,參考了幾個Youtuber,以及Reddit上的影片跟文字分享,把一些訣竅整理條列在下面。
Thumbnail
2023/06/26
這篇討論的是LoRA訓練裡面,可能是最重要的一步,就是選圖的標準,以及提示詞的選取策略。 最近在詳細研究到底要如何練出優質穩定的LoRA,參考了幾個Youtuber,以及Reddit上的影片跟文字分享,把一些訣竅整理條列在下面。
Thumbnail
2023/05/02
接續上一篇,我們開始用準備好的訓練素材圖跟規範圖來烘焙我們的高品質LoRA。
Thumbnail
2023/05/02
接續上一篇,我們開始用準備好的訓練素材圖跟規範圖來烘焙我們的高品質LoRA。
Thumbnail
2023/05/01
如何完全靠雲端運算,簡單產生高品質,穩定的角色LoRA,讓AI繪圖能在不同模型下產生一致的人物。上集。
Thumbnail
2023/05/01
如何完全靠雲端運算,簡單產生高品質,穩定的角色LoRA,讓AI繪圖能在不同模型下產生一致的人物。上集。
Thumbnail
看更多
你可能也想看
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
第二次複訊奇門遁甲課程時,高興碰到第一次上課的同學,依蘿也順手拿了好人緣噴霧請同學試用看看: 1. 同學A: 室內設計師,需要跑工地看客戶的房子,噴完後,覺得頭沒有那麼昏沉。 2. 同學B: 自由工作者,噴完後背後有密密麻麻的電流感,身體輕鬆許多。 3. 同學C: 喜歡自己動手做美食的家管
Thumbnail
第二次複訊奇門遁甲課程時,高興碰到第一次上課的同學,依蘿也順手拿了好人緣噴霧請同學試用看看: 1. 同學A: 室內設計師,需要跑工地看客戶的房子,噴完後,覺得頭沒有那麼昏沉。 2. 同學B: 自由工作者,噴完後背後有密密麻麻的電流感,身體輕鬆許多。 3. 同學C: 喜歡自己動手做美食的家管
Thumbnail
山日月表演工作坊-表演課L8羽樂分享 聖希老師融入更多之前的作業練習到課程中,從熱身開始的各種方式都變得更複雜了,不得不說進階表演班的作業不認真做真的只有等死一途,後面的課會變得沒辦法上課呀! 第八堂課開始大量地練習即興創作,從個人到團體,都要在短時間內用盡一切方式去表達不同
Thumbnail
山日月表演工作坊-表演課L8羽樂分享 聖希老師融入更多之前的作業練習到課程中,從熱身開始的各種方式都變得更複雜了,不得不說進階表演班的作業不認真做真的只有等死一途,後面的課會變得沒辦法上課呀! 第八堂課開始大量地練習即興創作,從個人到團體,都要在短時間內用盡一切方式去表達不同
Thumbnail
依蘿必須要自己承認,此個案讓依蘿一度以為療癒到自己或是身心靈工作者,能量場這麼乾淨的,依蘿只有在自己和同業上面看過,原來是個案長年吃素並且生活無虞,且對磁場也相當敏感,被這高標準的個案做11天的療癒,依蘿很開心,代表努力維持自身的能量是有目共睹的,另外也讓依蘿開啟了與個案最頻繁溝通的一次。 個
Thumbnail
依蘿必須要自己承認,此個案讓依蘿一度以為療癒到自己或是身心靈工作者,能量場這麼乾淨的,依蘿只有在自己和同業上面看過,原來是個案長年吃素並且生活無虞,且對磁場也相當敏感,被這高標準的個案做11天的療癒,依蘿很開心,代表努力維持自身的能量是有目共睹的,另外也讓依蘿開啟了與個案最頻繁溝通的一次。 個
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
🍀🍀🍀fumi老師:❤️❤️❤️ 🥰🥰🥰今天練習的是遠距離的靈氣療癒技術,「靈氣療癒師」這項技術蘊含著無窮的珍貴價值,不僅僅能夠帶來身心靈的療癒,更能引導對於生命課題帶來的學習。 🌸🌸🌸成為一名靈氣療癒師,意味著能夠成為他人療癒的橋樑,透過能量的傳遞與平衡,協助他人釋放身心的壓
Thumbnail
🍀🍀🍀fumi老師:❤️❤️❤️ 🥰🥰🥰今天練習的是遠距離的靈氣療癒技術,「靈氣療癒師」這項技術蘊含著無窮的珍貴價值,不僅僅能夠帶來身心靈的療癒,更能引導對於生命課題帶來的學習。 🌸🌸🌸成為一名靈氣療癒師,意味著能夠成為他人療癒的橋樑,透過能量的傳遞與平衡,協助他人釋放身心的壓
Thumbnail
這是一篇關於學習希塔療癒課程的心得分享,包括課程的感受、內容、以及對生活產生的影響。在課程結束後發現生活有了不同的選擇,能夠開心、平和地生活。透過挖掘轉換信念,發現自己能夠更好地處理困難的情況,對別人的情緒也能更穩定地應對。在課程中有許多豐富的實作練習,讓她有如學習魔法般的興奮感。
Thumbnail
這是一篇關於學習希塔療癒課程的心得分享,包括課程的感受、內容、以及對生活產生的影響。在課程結束後發現生活有了不同的選擇,能夠開心、平和地生活。透過挖掘轉換信念,發現自己能夠更好地處理困難的情況,對別人的情緒也能更穩定地應對。在課程中有許多豐富的實作練習,讓她有如學習魔法般的興奮感。
Thumbnail
🍀🍀🍀fumi老師:❤️❤️❤️ 🥰🥰🥰今天來練習遠距離靈氣療癒技術的同學說了一句話:「我要靠我自己的力量,不再靠外界的力量了!」,這句話讓我當下非常的動容。 🥰🥰🥰同學來上課的時候,Fumi老師就提醒同學:「靈魂所擁有的能力,你都擁有只是尚未覺醒而已,靠自己的力量去轉變自己的
Thumbnail
🍀🍀🍀fumi老師:❤️❤️❤️ 🥰🥰🥰今天來練習遠距離靈氣療癒技術的同學說了一句話:「我要靠我自己的力量,不再靠外界的力量了!」,這句話讓我當下非常的動容。 🥰🥰🥰同學來上課的時候,Fumi老師就提醒同學:「靈魂所擁有的能力,你都擁有只是尚未覺醒而已,靠自己的力量去轉變自己的
Thumbnail
今天晚上,上課拿到新版本的課本, 看到課本有有伊莉沙白老師的照片😆快樂. 這次的複訊, 我心裡有個答案了, 把所有人對我的愛,化為前進的力量發光! 在做療癒過程,與高我連結時! 聽到!他的聲音了. 為什麼知道!因為他的聲音一直都是穩穩頻率, 還有說話方式. 聽起來像是26-2
Thumbnail
今天晚上,上課拿到新版本的課本, 看到課本有有伊莉沙白老師的照片😆快樂. 這次的複訊, 我心裡有個答案了, 把所有人對我的愛,化為前進的力量發光! 在做療癒過程,與高我連結時! 聽到!他的聲音了. 為什麼知道!因為他的聲音一直都是穩穩頻率, 還有說話方式. 聽起來像是26-2
Thumbnail
當你進入某人的Aura時,你不僅在意識層面上與他們相遇,也在機理層面上與他們相遇。當一個未定義的中心與一個定義的中心連接時,它們不僅反映那個中心,還會放大它。
Thumbnail
當你進入某人的Aura時,你不僅在意識層面上與他們相遇,也在機理層面上與他們相遇。當一個未定義的中心與一個定義的中心連接時,它們不僅反映那個中心,還會放大它。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News