AI繪圖-用Lora打造你的夢幻模特兒吧!三集之一:Kohya's GUI安裝

閱讀時間約 11 分鐘

前言:為什麼你應該學習Lora的使用?

stable diffusion webui可以玩的很簡單,也可以玩的很複雜,相關的主題可以無盡擴散,其實一定是講不完的,所以我只挑重要的講。
這一篇的前提是假設你已經安裝好stable diffusion webui,如果沒有,就先從安裝stable diffusion webui這一步開始吧。
這次來講一下如何自己訓練Lora模型。Lora模型的訓練算是有點複雜,我一樣試著儘量講的淺顯易懂,它不難,只是步驟多而已。一般來說,我自己也是討厭麻煩事物的,但我認為Lora的實用性值得我麻煩一下,想玩stable diffusion webui的人我認為都有必要來學好這套工具,它值得花心思認識。
Lora模型為何重要呢?因為它可以直接針對特定的人物圖片做訓練,藉由Lora讓AI認識你想畫出的人物,這解除了一個常見的繪圖情境:你心中有個想畫的明確人物,但卻要自己在那邊拚拚湊湊最後還畫出個四不像。有了Lora之後你可以儘情的畫出你的偶像,你的夢中情人,你珍藏的動漫人物,還有你所有想畫但畫不出來的人。(但前提當然是你要有目標人物的圖片才行。)
以下展示一個簡單的例子,例如我如果想畫福音戰士的明日香的話,我選用Anything V4.5這個二次元繪圖模組,並且在prompt打上evangelion asuka(=福音戰士+明日香),並且用同一組prompt與同一組種子,分別畫兩張圖,一個是直接繪圖,另一個則是有呼叫福音戰士明日香的Lora模型。
先來看第一張直接繪製的圖:雖然它疑似還是有點認識這個動漫人物,紅髮與科幻風格的戰鬥服都算是福音戰士中明日香的特色,畫的也很漂亮,但問題是這根本就不像明日香啊,重點特徵好像有抓到但完全不是我想畫的人。
接著看看同一組設定下再多呼叫Lora的成果:這張圖就沒問題了,很明顯就是福音戰士的明日香這個角色了。
簡單的兩張圖就可以對比出Lora的效果與實用性了。
但Lora的用途是更廣泛的,並不是用動漫Lora就只能畫動漫圖,我再用同一組設定,但把繪圖模組改為寫實畫風的Chilloutmix,這樣就可畫出網路上流行的那些半真半假的cosplay人物圖了(這張圖是同設定下直出,我沒再特別挑好看的):
正因為它是這麼的實用也這麼的重要,所以我覺得它有寫一篇教學的價值。
Lora也是眾多自訓練的繪圖元件中相對易學易用的了,訓練過程也還算簡單快速,你如果怕麻煩,選擇其它的路只會更麻煩,其它模型訓練的操作步驟與訓練過程都相對複雜,我比較過後還是傾向於直接使用Lora就好了,使用AI繪圖工具我覺得有趣跟簡單是很重要的兩件事,這是一種娛樂我不想搞的像在弄專題研究一樣。
雖然我想儘量講的簡單一點,但訓練Lora過程確實有點複雜,我儘量整理出一個簡易而明確的安裝步驟。
我分三篇講,每篇只專注在簡單快速完成一件事就好,照著教學做好三件事時,Lora模型也訓練好了。

正題:開始安裝

以下進入正題,這篇我們先從Kohya's GUI的安裝開始講起:
首先,既然你現在想了解的是stable diffusion webui的進階應用,那我當然可以假設你的stable diffusion webui以及git都已經安裝完成了,那目前就只缺下列兩個軟體:

前置作業:安裝VS元件

Visual Studio 2015, 2017, 2019, and 2022 redistributable,這個沒難度直接從這邊下載安裝就行了,廢話我就不說了:下載點

準備安裝Kohya's GUI

Kohya's GUI,安裝這套軟體預留10GB的空間會比較保險。
安裝過程看似複雜,但匯整一下可以簡化成兩大步,第一步就是開啟特殊權限,第二步就是跑一堆指令,沒了。
會讓人覺得複雜的地方就是第二步一堆指令,但說穿了也是複製貼上的過程而已。

第一步:開啟權限

先從開始程式集中找到Windows PowerShell,按滑鼠右鍵以管理員身份執行。
在開啟的指令視窗中,執行下列指令:
Set-ExecutionPolicy Unrestricted
接著它會跳出警告並詢問是否確認,此時回答:A

第二步:執行一堆指令

再來就是看似麻煩,但其實就是一連串貼上指令執行的過程。
先另開一個PowerShell指令視窗(因為第一步開啟權限後要新開一個視窗才會使權限生效),先下指令切換到你想安裝這個軟體的位置。
接著執行下列指令將軟體下載回來:
git clone https://github.com/bmaltais/kohya_ss.git
以下為安裝過程示意圖,假設我想裝在D槽下就是先執行D:切到D槽,然後再執行git clone https://github.com/bmaltais/kohya_ss.git 即可:
接著就是要執行下方那堆指令,這邊就是心臟放給它大顆,直接一次全部複製然後全貼上PowerShell指令視窗中,直接一次全部讓他跑下去就行啦!
這樣子就完工啦,恁北才不想學那些湊字數的智障教學。
cd kohya_ss
python -m venv venv
.\venv\Scripts\activate
pip install torch==1.12.1+cu116 torchvision==0.13.1+cu116 --extra-index-url https://download.pytorch.org/whl/cu116
pip install --use-pep517 --upgrade -r requirements.txt
pip install -U -I --no-deps https://github.com/C43H66N12O12S2/stable-diffusion-webui/releases/download/f/xformers-0.0.14.dev0-cp310-cp310-win_amd64.whl
cp .\bitsandbytes_windows\*.dll .\venv\Lib\site-packages\bitsandbytes\
cp .\bitsandbytes_windows\cextension.py .\venv\Lib\site-packages\bitsandbytes\cextension.py
cp .\bitsandbytes_windows\main.py .\venv\Lib\site-packages\bitsandbytes\cuda_setup\main.py
accelerate config
在最後跑到accelerate config這條指令時,它應該會問你七個問題,如果你的環境也一樣是單機單顯卡,那你的答案就幾乎全照預設值就可以了,如果你的環境較特殊再依自己的情況作答。
一個單機單顯卡的凡人應該要回答的答案如下所示:
- -----------------------------------------------------------------------------------------------------------------------
In which compute environment are you running?
〈This machine〉  
(**第一題,預設值就是正確的,直接按Enter**)
------------------------------------------------------------------------------------------------------------------------
Which type of machine are you using?
〈No distributed training〉  
(**第二題,預設值就是正確的,直接按Enter**)
Do you want to run your training on CPU only 
(even if a GPU is available)? [yes/NO]:  
(**第三題,預設值就是正確的,直接按Enter**)
Do you wish to optimize your script with torch dynamo?[yes/NO]:  
(**第四題,預設值就是正確的,直接按Enter**)
Do you want to use DeepSpeed? [yes/NO]:  
(**第五題,預設值就是正確的,直接按Enter)
What GPU(s) (by id) should be used for training on 
this machine as a comma-seperated list? [all]:  
(**第六題,預設值就是正確的,直接按Enter**)
------------------------------------------------------------------------------------------------------------------------
Do you wish to use FP16 or BF16 (mixed precision)?
fp16 
(**第七題,住手!!這題不是預設值,這邊要用數字鍵做選擇,
先按數字鍵1選到fp16再按Enter**)
這樣就完成Kohya's GUI的安裝了,表面看來複雜,但真的只要做兩件事就行了,到這邊你也完成訓練Lora要做的三件事中的第一件了,而且這個安裝過程只有第一次需要執行,之後就再也不用煩惱了。
=====================================

額外補充:

補充一件事:如果你的顯卡型號比較新,是NVIDIA 30X0/40X0系列的顯卡的話,可以再多裝一個元件可以提昇訓練效能。
2.解壓縮後將元件資料夾cudnn_windows整個複製到Kohya's GUI軟體根目錄下
接著開啟命令提示字元(dos視窗)或是直接繼續用powershell視窗都可以,
先切換到Kohya's GUI軟體根目錄,然後執行下列指令即可完成元件安裝:
.\venv\Scripts\activate
python .\tools\cudann_1.8_install.py
為什麼會看到廣告
275會員
90內容數
沙龍自介: 雜文派,舉凡AI介紹、科技新知、廢談網誌、小說動漫通通都寫。雖說如此,但目前以AI與科技類文章為主軸,我也不知道怎麼變這樣的,holy 媽祖。 本人不喜歡看長篇文章,也不擅長寫長篇文章,我的意思是:我的優點是廢話很少,看我一篇文不會花你太多時間。
留言0
查看全部
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Bing目前沒辦法有效固定角色模樣,所以如果想生成同角色、不同場景、動作的圖,要如何實現呢? 我換了一個思路,試作出同人一圖2分格的畫面,歡迎賞圖。
Thumbnail
AI繪圖在繪畫、攝影、及影片製作領域中已成為不可忽視的技術,了解AI繪圖趨勢並善用線上AI繪圖生成器及畫質修復軟體,幫助你輕鬆打造高品質AI生成照片。
Thumbnail
AI繪圖透過機器學習與深度學習等技術進行圖像的自動化生成,和傳統繪圖依賴藝術家的創作技巧、創意與觀察相比,AI繪圖更偏重於電腦的技術與算法。通過對大量數據的分析和學習,AI繪圖提供快速生成和修改圖像的能力,拓展了藝術創作不同的
Thumbnail
在AI繪圖剛剛出來的時候,大家紛紛開始擔心,好奇,嘗試,但是好像對一般的人生活影響不大,說是會取代畫師與藝術家,可是這不是大多數人的職業呀! 那麼我們普通人,可以使用這個跨世代的技術做什麼呢? 今天,我將帶來AI繪圖領域中一般人可以使用的幾種常見的使用方式與思路,幫助大家釐清AI繪圖的定位
Thumbnail
在我們上一篇文章中,提到了生成AI Art QR Code的方法。今天這一篇中我們要實戰另一種生成AI QR Code的方法。上一篇的方法需要由經由 X/Y/Z測試去獲得最佳的參數,且套用不同的Model/Lora都需要去找最佳的甜蜜點,這樣難免比較累一點,今天我會介紹一個方式,是相對比較穩定的做法
Thumbnail
Hi 大家好; 應該有很多朋友在我的 FB https://www.facebook.com/bjshih 上看到我經常分享 AI 繪圖作品,以及兩本入門書籍。 但是由於種種因素,始終不敢放手讓自己飛,所以,我決定再寫一小篇"入門的入門",帶大家進入 AI 繪圖的世界,三大特色:免費!不用寫程式!不
Thumbnail
各種不同的構圖方式,以及不同特寫程度的角色畫面,再到畫面中人物呈現的數量差別。
只見阿杰桌上煙灰缸裡的煙頭滿了出來,嘴裏還叼著剛點上的香菸,我唯唯諾諾的走到他旁邊等他將第8版的修改給我「請問這版修改大概多久可以完成?」我小心的詢問「嗯…快了…」,阿杰的回答簡潔,但含糊不清,似乎還有話在嘴裡「…幹!這“電腦”是怎樣,露出3/5和露出6/10的比例是差在哪?整個電影就賣電腦好啦!」
Thumbnail
透過大量圖像資料庫訓練達成的結果 開始之前大概講一下,AI繪圖藉著大量圖像資料庫訓練後,由使用者下「關鍵字」(詠唱),AI就會透過強大的運算功能,隨機產生一個相應圖像,隨著AI進化,這些畫作或圖像已經變得真假難辨,無法得知它是否由AI運算產生,還是真實的人類創作。
Thumbnail
由Open AI公司所展發出來的DALL.E2,雖有聽過,但一直沒實際使用。之前玩過Mid-Journey (見Midjourney的AI作畫會超越真人藝術家嗎?),試畫了幾張圖,已經覺得AI很神奇了。 最近讀了這篇文章: 如何尋找創作靈感 (By David AI),覺得插圖十分驚艷,於是馬上登入
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Bing目前沒辦法有效固定角色模樣,所以如果想生成同角色、不同場景、動作的圖,要如何實現呢? 我換了一個思路,試作出同人一圖2分格的畫面,歡迎賞圖。
Thumbnail
AI繪圖在繪畫、攝影、及影片製作領域中已成為不可忽視的技術,了解AI繪圖趨勢並善用線上AI繪圖生成器及畫質修復軟體,幫助你輕鬆打造高品質AI生成照片。
Thumbnail
AI繪圖透過機器學習與深度學習等技術進行圖像的自動化生成,和傳統繪圖依賴藝術家的創作技巧、創意與觀察相比,AI繪圖更偏重於電腦的技術與算法。通過對大量數據的分析和學習,AI繪圖提供快速生成和修改圖像的能力,拓展了藝術創作不同的
Thumbnail
在AI繪圖剛剛出來的時候,大家紛紛開始擔心,好奇,嘗試,但是好像對一般的人生活影響不大,說是會取代畫師與藝術家,可是這不是大多數人的職業呀! 那麼我們普通人,可以使用這個跨世代的技術做什麼呢? 今天,我將帶來AI繪圖領域中一般人可以使用的幾種常見的使用方式與思路,幫助大家釐清AI繪圖的定位
Thumbnail
在我們上一篇文章中,提到了生成AI Art QR Code的方法。今天這一篇中我們要實戰另一種生成AI QR Code的方法。上一篇的方法需要由經由 X/Y/Z測試去獲得最佳的參數,且套用不同的Model/Lora都需要去找最佳的甜蜜點,這樣難免比較累一點,今天我會介紹一個方式,是相對比較穩定的做法
Thumbnail
Hi 大家好; 應該有很多朋友在我的 FB https://www.facebook.com/bjshih 上看到我經常分享 AI 繪圖作品,以及兩本入門書籍。 但是由於種種因素,始終不敢放手讓自己飛,所以,我決定再寫一小篇"入門的入門",帶大家進入 AI 繪圖的世界,三大特色:免費!不用寫程式!不
Thumbnail
各種不同的構圖方式,以及不同特寫程度的角色畫面,再到畫面中人物呈現的數量差別。
只見阿杰桌上煙灰缸裡的煙頭滿了出來,嘴裏還叼著剛點上的香菸,我唯唯諾諾的走到他旁邊等他將第8版的修改給我「請問這版修改大概多久可以完成?」我小心的詢問「嗯…快了…」,阿杰的回答簡潔,但含糊不清,似乎還有話在嘴裡「…幹!這“電腦”是怎樣,露出3/5和露出6/10的比例是差在哪?整個電影就賣電腦好啦!」
Thumbnail
透過大量圖像資料庫訓練達成的結果 開始之前大概講一下,AI繪圖藉著大量圖像資料庫訓練後,由使用者下「關鍵字」(詠唱),AI就會透過強大的運算功能,隨機產生一個相應圖像,隨著AI進化,這些畫作或圖像已經變得真假難辨,無法得知它是否由AI運算產生,還是真實的人類創作。
Thumbnail
由Open AI公司所展發出來的DALL.E2,雖有聽過,但一直沒實際使用。之前玩過Mid-Journey (見Midjourney的AI作畫會超越真人藝術家嗎?),試畫了幾張圖,已經覺得AI很神奇了。 最近讀了這篇文章: 如何尋找創作靈感 (By David AI),覺得插圖十分驚艷,於是馬上登入