AI繪圖-用Lora打造你的夢幻模特兒吧!三集之一:Kohya's GUI安裝

閱讀時間約 11 分鐘

前言:為什麼你應該學習Lora的使用?

stable diffusion webui可以玩的很簡單,也可以玩的很複雜,相關的主題可以無盡擴散,其實一定是講不完的,所以我只挑重要的講。
這一篇的前提是假設你已經安裝好stable diffusion webui,如果沒有,就先從安裝stable diffusion webui這一步開始吧。
這次來講一下如何自己訓練Lora模型。Lora模型的訓練算是有點複雜,我一樣試著儘量講的淺顯易懂,它不難,只是步驟多而已。一般來說,我自己也是討厭麻煩事物的,但我認為Lora的實用性值得我麻煩一下,想玩stable diffusion webui的人我認為都有必要來學好這套工具,它值得花心思認識。
Lora模型為何重要呢?因為它可以直接針對特定的人物圖片做訓練,藉由Lora讓AI認識你想畫出的人物,這解除了一個常見的繪圖情境:你心中有個想畫的明確人物,但卻要自己在那邊拚拚湊湊最後還畫出個四不像。有了Lora之後你可以儘情的畫出你的偶像,你的夢中情人,你珍藏的動漫人物,還有你所有想畫但畫不出來的人。(但前提當然是你要有目標人物的圖片才行。)
以下展示一個簡單的例子,例如我如果想畫福音戰士的明日香的話,我選用Anything V4.5這個二次元繪圖模組,並且在prompt打上evangelion asuka(=福音戰士+明日香),並且用同一組prompt與同一組種子,分別畫兩張圖,一個是直接繪圖,另一個則是有呼叫福音戰士明日香的Lora模型。
先來看第一張直接繪製的圖:雖然它疑似還是有點認識這個動漫人物,紅髮與科幻風格的戰鬥服都算是福音戰士中明日香的特色,畫的也很漂亮,但問題是這根本就不像明日香啊,重點特徵好像有抓到但完全不是我想畫的人。
接著看看同一組設定下再多呼叫Lora的成果:這張圖就沒問題了,很明顯就是福音戰士的明日香這個角色了。
簡單的兩張圖就可以對比出Lora的效果與實用性了。
但Lora的用途是更廣泛的,並不是用動漫Lora就只能畫動漫圖,我再用同一組設定,但把繪圖模組改為寫實畫風的Chilloutmix,這樣就可畫出網路上流行的那些半真半假的cosplay人物圖了(這張圖是同設定下直出,我沒再特別挑好看的):
正因為它是這麼的實用也這麼的重要,所以我覺得它有寫一篇教學的價值。
Lora也是眾多自訓練的繪圖元件中相對易學易用的了,訓練過程也還算簡單快速,你如果怕麻煩,選擇其它的路只會更麻煩,其它模型訓練的操作步驟與訓練過程都相對複雜,我比較過後還是傾向於直接使用Lora就好了,使用AI繪圖工具我覺得有趣跟簡單是很重要的兩件事,這是一種娛樂我不想搞的像在弄專題研究一樣。
雖然我想儘量講的簡單一點,但訓練Lora過程確實有點複雜,我儘量整理出一個簡易而明確的安裝步驟。
我分三篇講,每篇只專注在簡單快速完成一件事就好,照著教學做好三件事時,Lora模型也訓練好了。

正題:開始安裝

以下進入正題,這篇我們先從Kohya's GUI的安裝開始講起:
首先,既然你現在想了解的是stable diffusion webui的進階應用,那我當然可以假設你的stable diffusion webui以及git都已經安裝完成了,那目前就只缺下列兩個軟體:

前置作業:安裝VS元件

Visual Studio 2015, 2017, 2019, and 2022 redistributable,這個沒難度直接從這邊下載安裝就行了,廢話我就不說了:下載點

準備安裝Kohya's GUI

Kohya's GUI,安裝這套軟體預留10GB的空間會比較保險。
安裝過程看似複雜,但匯整一下可以簡化成兩大步,第一步就是開啟特殊權限,第二步就是跑一堆指令,沒了。
會讓人覺得複雜的地方就是第二步一堆指令,但說穿了也是複製貼上的過程而已。

第一步:開啟權限

先從開始程式集中找到Windows PowerShell,按滑鼠右鍵以管理員身份執行。
在開啟的指令視窗中,執行下列指令:
Set-ExecutionPolicy Unrestricted
接著它會跳出警告並詢問是否確認,此時回答:A

第二步:執行一堆指令

再來就是看似麻煩,但其實就是一連串貼上指令執行的過程。
先另開一個PowerShell指令視窗(因為第一步開啟權限後要新開一個視窗才會使權限生效),先下指令切換到你想安裝這個軟體的位置。
接著執行下列指令將軟體下載回來:
git clone https://github.com/bmaltais/kohya_ss.git
以下為安裝過程示意圖,假設我想裝在D槽下就是先執行D:切到D槽,然後再執行git clone https://github.com/bmaltais/kohya_ss.git 即可:
接著就是要執行下方那堆指令,這邊就是心臟放給它大顆,直接一次全部複製然後全貼上PowerShell指令視窗中,直接一次全部讓他跑下去就行啦!
這樣子就完工啦,恁北才不想學那些湊字數的智障教學。
cd kohya_ss
python -m venv venv
.\venv\Scripts\activate
pip install torch==1.12.1+cu116 torchvision==0.13.1+cu116 --extra-index-url https://download.pytorch.org/whl/cu116
pip install --use-pep517 --upgrade -r requirements.txt
pip install -U -I --no-deps https://github.com/C43H66N12O12S2/stable-diffusion-webui/releases/download/f/xformers-0.0.14.dev0-cp310-cp310-win_amd64.whl
cp .\bitsandbytes_windows\*.dll .\venv\Lib\site-packages\bitsandbytes\
cp .\bitsandbytes_windows\cextension.py .\venv\Lib\site-packages\bitsandbytes\cextension.py
cp .\bitsandbytes_windows\main.py .\venv\Lib\site-packages\bitsandbytes\cuda_setup\main.py
accelerate config
在最後跑到accelerate config這條指令時,它應該會問你七個問題,如果你的環境也一樣是單機單顯卡,那你的答案就幾乎全照預設值就可以了,如果你的環境較特殊再依自己的情況作答。
一個單機單顯卡的凡人應該要回答的答案如下所示:
- -----------------------------------------------------------------------------------------------------------------------
In which compute environment are you running?
〈This machine〉  
(**第一題,預設值就是正確的,直接按Enter**)
------------------------------------------------------------------------------------------------------------------------
Which type of machine are you using?
〈No distributed training〉  
(**第二題,預設值就是正確的,直接按Enter**)
Do you want to run your training on CPU only 
(even if a GPU is available)? [yes/NO]:  
(**第三題,預設值就是正確的,直接按Enter**)
Do you wish to optimize your script with torch dynamo?[yes/NO]:  
(**第四題,預設值就是正確的,直接按Enter**)
Do you want to use DeepSpeed? [yes/NO]:  
(**第五題,預設值就是正確的,直接按Enter)
What GPU(s) (by id) should be used for training on 
this machine as a comma-seperated list? [all]:  
(**第六題,預設值就是正確的,直接按Enter**)
------------------------------------------------------------------------------------------------------------------------
Do you wish to use FP16 or BF16 (mixed precision)?
fp16 
(**第七題,住手!!這題不是預設值,這邊要用數字鍵做選擇,
先按數字鍵1選到fp16再按Enter**)
這樣就完成Kohya's GUI的安裝了,表面看來複雜,但真的只要做兩件事就行了,到這邊你也完成訓練Lora要做的三件事中的第一件了,而且這個安裝過程只有第一次需要執行,之後就再也不用煩惱了。
=====================================

額外補充:

補充一件事:如果你的顯卡型號比較新,是NVIDIA 30X0/40X0系列的顯卡的話,可以再多裝一個元件可以提昇訓練效能。
2.解壓縮後將元件資料夾cudnn_windows整個複製到Kohya's GUI軟體根目錄下
接著開啟命令提示字元(dos視窗)或是直接繼續用powershell視窗都可以,
先切換到Kohya's GUI軟體根目錄,然後執行下列指令即可完成元件安裝:
.\venv\Scripts\activate
python .\tools\cudann_1.8_install.py
為什麼會看到廣告
276會員
90內容數
沙龍自介: 雜文派,舉凡AI介紹、科技新知、廢談網誌、小說動漫通通都寫。雖說如此,但目前以AI與科技類文章為主軸,我也不知道怎麼變這樣的,holy 媽祖。 本人不喜歡看長篇文章,也不擅長寫長篇文章,我的意思是:我的優點是廢話很少,看我一篇文不會花你太多時間。
留言0
查看全部
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
Bing目前沒辦法有效固定角色模樣,所以如果想生成同角色、不同場景、動作的圖,要如何實現呢? 我換了一個思路,試作出同人一圖2分格的畫面,歡迎賞圖。
Thumbnail
AI繪圖在繪畫、攝影、及影片製作領域中已成為不可忽視的技術,了解AI繪圖趨勢並善用線上AI繪圖生成器及畫質修復軟體,幫助你輕鬆打造高品質AI生成照片。
Thumbnail
AI繪圖透過機器學習與深度學習等技術進行圖像的自動化生成,和傳統繪圖依賴藝術家的創作技巧、創意與觀察相比,AI繪圖更偏重於電腦的技術與算法。通過對大量數據的分析和學習,AI繪圖提供快速生成和修改圖像的能力,拓展了藝術創作不同的
Thumbnail
在AI繪圖剛剛出來的時候,大家紛紛開始擔心,好奇,嘗試,但是好像對一般的人生活影響不大,說是會取代畫師與藝術家,可是這不是大多數人的職業呀! 那麼我們普通人,可以使用這個跨世代的技術做什麼呢? 今天,我將帶來AI繪圖領域中一般人可以使用的幾種常見的使用方式與思路,幫助大家釐清AI繪圖的定位
Thumbnail
在我們上一篇文章中,提到了生成AI Art QR Code的方法。今天這一篇中我們要實戰另一種生成AI QR Code的方法。上一篇的方法需要由經由 X/Y/Z測試去獲得最佳的參數,且套用不同的Model/Lora都需要去找最佳的甜蜜點,這樣難免比較累一點,今天我會介紹一個方式,是相對比較穩定的做法
Thumbnail
Hi 大家好; 應該有很多朋友在我的 FB https://www.facebook.com/bjshih 上看到我經常分享 AI 繪圖作品,以及兩本入門書籍。 但是由於種種因素,始終不敢放手讓自己飛,所以,我決定再寫一小篇"入門的入門",帶大家進入 AI 繪圖的世界,三大特色:免費!不用寫程式!不
Thumbnail
各種不同的構圖方式,以及不同特寫程度的角色畫面,再到畫面中人物呈現的數量差別。
只見阿杰桌上煙灰缸裡的煙頭滿了出來,嘴裏還叼著剛點上的香菸,我唯唯諾諾的走到他旁邊等他將第8版的修改給我「請問這版修改大概多久可以完成?」我小心的詢問「嗯…快了…」,阿杰的回答簡潔,但含糊不清,似乎還有話在嘴裡「…幹!這“電腦”是怎樣,露出3/5和露出6/10的比例是差在哪?整個電影就賣電腦好啦!」
Thumbnail
透過大量圖像資料庫訓練達成的結果 開始之前大概講一下,AI繪圖藉著大量圖像資料庫訓練後,由使用者下「關鍵字」(詠唱),AI就會透過強大的運算功能,隨機產生一個相應圖像,隨著AI進化,這些畫作或圖像已經變得真假難辨,無法得知它是否由AI運算產生,還是真實的人類創作。
Thumbnail
由Open AI公司所展發出來的DALL.E2,雖有聽過,但一直沒實際使用。之前玩過Mid-Journey (見Midjourney的AI作畫會超越真人藝術家嗎?),試畫了幾張圖,已經覺得AI很神奇了。 最近讀了這篇文章: 如何尋找創作靈感 (By David AI),覺得插圖十分驚艷,於是馬上登入
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
Bing目前沒辦法有效固定角色模樣,所以如果想生成同角色、不同場景、動作的圖,要如何實現呢? 我換了一個思路,試作出同人一圖2分格的畫面,歡迎賞圖。
Thumbnail
AI繪圖在繪畫、攝影、及影片製作領域中已成為不可忽視的技術,了解AI繪圖趨勢並善用線上AI繪圖生成器及畫質修復軟體,幫助你輕鬆打造高品質AI生成照片。
Thumbnail
AI繪圖透過機器學習與深度學習等技術進行圖像的自動化生成,和傳統繪圖依賴藝術家的創作技巧、創意與觀察相比,AI繪圖更偏重於電腦的技術與算法。通過對大量數據的分析和學習,AI繪圖提供快速生成和修改圖像的能力,拓展了藝術創作不同的
Thumbnail
在AI繪圖剛剛出來的時候,大家紛紛開始擔心,好奇,嘗試,但是好像對一般的人生活影響不大,說是會取代畫師與藝術家,可是這不是大多數人的職業呀! 那麼我們普通人,可以使用這個跨世代的技術做什麼呢? 今天,我將帶來AI繪圖領域中一般人可以使用的幾種常見的使用方式與思路,幫助大家釐清AI繪圖的定位
Thumbnail
在我們上一篇文章中,提到了生成AI Art QR Code的方法。今天這一篇中我們要實戰另一種生成AI QR Code的方法。上一篇的方法需要由經由 X/Y/Z測試去獲得最佳的參數,且套用不同的Model/Lora都需要去找最佳的甜蜜點,這樣難免比較累一點,今天我會介紹一個方式,是相對比較穩定的做法
Thumbnail
Hi 大家好; 應該有很多朋友在我的 FB https://www.facebook.com/bjshih 上看到我經常分享 AI 繪圖作品,以及兩本入門書籍。 但是由於種種因素,始終不敢放手讓自己飛,所以,我決定再寫一小篇"入門的入門",帶大家進入 AI 繪圖的世界,三大特色:免費!不用寫程式!不
Thumbnail
各種不同的構圖方式,以及不同特寫程度的角色畫面,再到畫面中人物呈現的數量差別。
只見阿杰桌上煙灰缸裡的煙頭滿了出來,嘴裏還叼著剛點上的香菸,我唯唯諾諾的走到他旁邊等他將第8版的修改給我「請問這版修改大概多久可以完成?」我小心的詢問「嗯…快了…」,阿杰的回答簡潔,但含糊不清,似乎還有話在嘴裡「…幹!這“電腦”是怎樣,露出3/5和露出6/10的比例是差在哪?整個電影就賣電腦好啦!」
Thumbnail
透過大量圖像資料庫訓練達成的結果 開始之前大概講一下,AI繪圖藉著大量圖像資料庫訓練後,由使用者下「關鍵字」(詠唱),AI就會透過強大的運算功能,隨機產生一個相應圖像,隨著AI進化,這些畫作或圖像已經變得真假難辨,無法得知它是否由AI運算產生,還是真實的人類創作。
Thumbnail
由Open AI公司所展發出來的DALL.E2,雖有聽過,但一直沒實際使用。之前玩過Mid-Journey (見Midjourney的AI作畫會超越真人藝術家嗎?),試畫了幾張圖,已經覺得AI很神奇了。 最近讀了這篇文章: 如何尋找創作靈感 (By David AI),覺得插圖十分驚艷,於是馬上登入