方格精選

Stable Diffusion練習,漫畫,姊妹會秘儀

更新於 2023/06/19閱讀時間約 9 分鐘
第一頁草稿與成品對比

前言

本篇要來分享一下製作 (漫畫)姊妹會秘儀 -- Stable Diffusion繪製 時用到的各種AI生成技巧。
很多時候,為了將心中一個想法實現,必須用上許多自己原先不會的技巧,雖然過程是痛苦的、掙扎的,但是這樣一點一滴邁向終點,過程之中會慢慢進化,當到達時,就會發現收穫的不只是成果,還有一路上學到的新技能。
一個多月前實驗一個想法時,偶然刷到了一張稀有等級的構圖。當我看見那張圖的瞬間,一大篇小說的草稿就從我腦海深處浮現出來,甚至某些畫面就栩栩如生在我眼前展開,靈光一閃之際,暗自決定要將其中一些片段當作練習,試著將它做成漫畫形式。
在三個月之前,美術能力為零,作畫上限是火柴人的我而言,實現難度是無限大,實現時間是無限長。但是在AI算圖的時代,從技術準備加摸索,總共是一個月,實作時間是六個小時。在這個時代,想做出漫畫但繪畫技巧為零的人是幸福的。

第二頁

第二頁,姊妹會秘儀,完成版
故事要從第二頁開始,在實驗 Stable Diffusion提示詞訣竅(九) 提到的狂野生圖法時,使用提示詞storyboard(電影分鏡)時偶然刷到了超稀有等級的圖片。雖然剛出現時,所有角色的臉都是崩的(其實是連一張完整的臉都沒有),但是經過放大與臉崩修復之後,整個氣勢就出來了。角色們的表情與整體氛圍都在敘述一個故事。
為了講述這個故事,我用我極為有限的繪畫能力畫了一張銜接這個關鍵格的一頁草稿,就是文章開頭那張筆記本頁面上的火柴人分鏡稿。
為了實現這一頁所需要的技術,我根本就還不具備,為了搞清楚到底如何使用AI來將這一頁做出來,我邊看關於如何畫漫畫的文章與影片,邊摸索如何使用AI與簡單的繪圖軟體來製造一個能看的成品。
在這一個月之中,我寫的AI學習心得文之中,十篇裡面有七篇是為了這個目標有方向地研究。終於讓我覺得有一套可行的方法與技術可以把它做出來。
首先是第二頁的打磨,將圖放大兩倍再使用 Stable Diffusion進階 -- 臉崩修復 來修復每個人物的臉之後,繼續放大兩倍。這時候還有許多細節需要打磨,但因為整張圖已經太大,無法一次塞進Automatic1111裡面處理,所以我需要使用繪圖軟體將圖片分區剪裁,每區為包含一個人物的768x1024長條圖,一區一區餵進Automatic1111之後,Inpaint中央部分的臉、頭髮與胸部之後再拼接回原圖,這樣才能保證重繪的地方不會讓拼接圖出現銜接縫。

第一頁

而為了將第一頁從草稿變成漫畫稿,花費的時間比第二頁多了幾十倍
首先,要解決Stable Diffusion或甚至可說整個AI繪圖目前最大的問題:角色不穩定性。Stable Diffusion的解決方法是使用LoRA來為人物訓練專屬的小模型,但在這邊有個難題,就是我只有一張圖,而訓練LoRA需要用到最少二十張圖才有穩定的品質。幸好這問題在ControlNet的Reference模型出來之後就迎刃而解囉。
第一頁第一格,芙悠
我找出了一個可以用單張高畫質圖片來訓練動畫角色LoRA的方法,詳細流程寫在了 Stable Diffusion -- 訓練LoRA(五) 裡面,並用這個方法替第一頁的主要角色訓練了LoRA,這樣就能在每一格都重現同一個人物。
接下來的第二格則是另一個問題,那就是大部分的ACG與2.5D模型都有的通病——光源太亮,而這整個故事的場景都是在夜晚,而且是穩定光源非常昂貴的中古背景奇幻世界,除了使用繪圖軟體調暗亮度,並且手刻光影之外,另一個可行且有趣的方法就是指示AI如何用我指定的光源塗佈畫面。
第一頁第二格,哈娜
Stable Diffusion進階 -- 光影控制 裡面,我發覺一個我原本覺得華而不實,純粹展示技巧的技術其實在這種場合非常有用,就是使用遮罩引導AI分配光線。我用下面的黑白遮罩引導AI在圖片右方做出唯一的光源,搭配上ControlNet的Openpose與Depth維持人物的姿勢與深淺做出第二格。
光源參考遮罩
但是出來的半完成品中,人物的左右衣袖原本都是紅色的,試了幾個方法之後,最後我用了 Stable Diffusion基礎 -- 塗鴉(Sketch) 裡提到的Inpaint Sketch功能塗白整條手臂再重繪,這樣才順利將她的服裝變成全白棉質。所以,不管當初學到的時候覺得這個技能有多無用,只要會用,知道使用的時機,就沒有廢技。
再來就是我花最多時間處理的第三格。AI算圖的另一個大問題是,它無法穩定維持在同一套衣服上,尤其是很多漂亮複雜的衣服其實沒有合適的提示詞來形容。這時候Inpaint就發揮了非常、非常重要的功能。
第一頁第三格,芙悠背影
Stable Diffusion基礎 -- 局部重繪的應用 裡面,四種不同的Mask Content都是用同一個圖,也就是芙悠穿著晚禮服走上樓梯的第三格來當示範,因為這就是我學習Inpaint不同參數的動力來源,想要將草稿的動態與背景做出成品的願望激勵著我。我使用Inpaint的不同選項做了以下修改:
  • Fill:將左右完全不一致的樓梯重繪成了正常的樓梯。
  • Original:將禮服的背面材質置換成與第二頁一致的藍色星星紗,同時保持了裸背的晚禮服形狀。
  • Latent Nothing:將晚禮服臀部上的多餘金邊裝飾移除掉,同時保持原本的光影與曲線。
使用Inpaint處理這些部分之後,剩下的服裝不一致只能靠繪圖軟體自己想辦法剪貼拼裝上之後再用img2img來重繪光影,並且讓浮浮的拼貼裝飾(頭飾,臂環)貼回人體身上。
而人物被算壞掉的左手,則是使用 Stable Diffusion進階 -- 手部修復 提到的方法,在人偶姿勢網站做出一樣的手,再拼接回原圖之後用Inpaint修復。
這些都完成之後,製作漫畫的素材就到齊了,剩下的就是用繪圖軟體將圖拼接起來,製作頁面、框線、陰影與對話框,這就超出本文的範圍了。

翻譯

講一個題外話,在我寫中文台詞時,其實是先在腦海產生英文的台詞,再轉成中文寫下來,這樣比較不會讓西方奇幻背景的故事有太重的中文味。但是在製作漫畫的英文台詞時,我並沒有直接使用當初的台詞,而是把中文版的台詞拿去詢問ChatGPT,沒想到ChatGPT產生出來的英文台詞非常好,遠超過我自己想的英文原台詞。只需要一些簡單提示,ChatGPT就能做出合理的翻譯,且翻出好幾個版本讓我選擇,我在數個版本之間挑選最符合角色的個性、知識程度與出身階級的段落,拼接重整之後得到了可以用在漫畫裡的版本。
我在ChatGPT使用的提示文字是:
一篇短篇小說中的對話,有兩名角色,哈娜(Hana)與芙悠(Fuyu),一個民族名稱,泰洛斯(Thelos),將以下這段小說內文翻譯成英文:
我相信日後只要提供更詳細的背景設定提示詞,ChatGPT就能為我提供更精細的翻譯,但是目前這樣簡單的提示詞就足夠幫助我完成兩頁英文版的翻譯了。

結語

做完這個短短兩頁的漫畫,有一種不可思議的感覺,畢竟這種事情在AI時代之前是壓根就不可能實現的。但是現在,一切都有可能。只是需要一些些繪圖軟體的使用技巧,還有很多的AI算圖知識,加上試錯的時間與結合不同技術的創意,就有辦法達到。
在這個時代,想做出美麗圖畫但畫技為零的人是幸福的。
祝大家AI算圖愉快!至少,我是痛並快樂著。
即將進入廣告,捲動後可繼續閱讀
為什麼會看到廣告
avatar-img
21.6K會員
365內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
這篇要來示範將幾個AI算圖技巧綜合起來之後,如何得到「草地唸書」的完成圖。
這篇主要來講解一下Inpaint的作用,跟這個功能如何幫助我們一點一點改畫一個原始概念,直到整幅畫符合需求。 這幅作品的概念是要藉由人類與機器人的互動,來展現人類在機械與AI支配的未來的景況。
這篇要來做一個算是簡單,但是不算無腦的練習。一日,我想要換掉在方格子與Instgram上的大頭貼,換成一個更貼近自己喜歡的主題的圓形大頭貼。
像公主抱這種姿勢, 對於Stable Diffusion來說其實異常困難。最主要是因為這個姿勢牽涉兩個人,肢體是互相重疊在一起,而且很多地方都會露出手與手指。更別提通常這是男抱女,兩種不同性別的人物的貼身互動。 於是SD常常會算出惡夢般的成品......
這次來用一些好用的手法,達到在Stable Diffusion裡面畫出誇張姿勢的方法。
這篇要來示範將幾個AI算圖技巧綜合起來之後,如何得到「草地唸書」的完成圖。
這篇主要來講解一下Inpaint的作用,跟這個功能如何幫助我們一點一點改畫一個原始概念,直到整幅畫符合需求。 這幅作品的概念是要藉由人類與機器人的互動,來展現人類在機械與AI支配的未來的景況。
這篇要來做一個算是簡單,但是不算無腦的練習。一日,我想要換掉在方格子與Instgram上的大頭貼,換成一個更貼近自己喜歡的主題的圓形大頭貼。
像公主抱這種姿勢, 對於Stable Diffusion來說其實異常困難。最主要是因為這個姿勢牽涉兩個人,肢體是互相重疊在一起,而且很多地方都會露出手與手指。更別提通常這是男抱女,兩種不同性別的人物的貼身互動。 於是SD常常會算出惡夢般的成品......
這次來用一些好用的手法,達到在Stable Diffusion裡面畫出誇張姿勢的方法。
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
本文介紹ReActor這套AI換臉軟體,它是stable diffusion外掛之一,可以視為deepFake與Lora的簡易替代品,易用好上手。 內容從基礎安裝開始講解,亦包含實際操作過程與圖片範例。 為免侵犯敏感人物的肖象權,內文以川普換與拜登做為例子。
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
在 Stable Diffusion 中有時人物的大小遠近好像很隨機,除了用 ControlNet 其實可以利用 prompt 輸入 拍攝電影的鏡頭控制術語用來控制距離及角度。
Thumbnail
Getty Images推出AI圖像生成工具,與Nvidia合作保障版權 圖片供應商Getty Images日前宣布,將與晶片大廠Nvidia合作,推出名為「Generative AI by Getty Images」的AI圖像生成工具。該工具運用了Getty Images豐富的授權圖片資料庫
Thumbnail
中二病少女這次去了外星球,化身複製人大軍,身穿帝國的暴風兵裝備,這次一樣用realistic fantasy模型,再搭配其他的(你知道的專作瑟瑟圖的那種模型)試試看效果,去呈現荒涼外星球的戰鬥。但星際大戰的光劍始終都很怪很可笑,等下可以看。 這次表情沒下提示詞連笑都不笑,同伴倒下也呈現呆滯狀,表現的
Thumbnail
本文探討了反向詞(Negative Embedding)的概念,並介紹了在 Stable Diffusion WebUI 中使用的幾種模型,包括 EasyNegative、bad_prompt_version2、bad-hands-5 和 Deep Negative V1.x。這些模型的主要目的是在
Thumbnail
txt2img 時,會用 512、768 等等大小來測試算圖,反覆迭代找到一個適合的 prompt 和參數組合。如果想要以此組合算出高解析度的圖片,直接調整長寬會遇到畫面跑掉的問題。該如何在固定構圖的情況下增加圖片的解析度呢?本文提供三個方法讓大家嘗試看看!
Thumbnail
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
Thumbnail
本教學使用Automatic 1111介面   AI繪圖風行至今,網上已有不少中文教學,包括教導如何訓練LoRA、LoCon等模型的文章,而訓練上述模型時,通常會經過一道「Preprocess Images」工序,中文稱為「圖片預處理」。
Thumbnail
stable diffusion 是一款AI繪圖軟體,你可以免費把stable diffusion算出來的圖免費拿來商用,但是像我的電腦因為顯卡太舊而無法快速運行,而浪費很多時間,你只要準備一個google帳號即可。
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
本文介紹ReActor這套AI換臉軟體,它是stable diffusion外掛之一,可以視為deepFake與Lora的簡易替代品,易用好上手。 內容從基礎安裝開始講解,亦包含實際操作過程與圖片範例。 為免侵犯敏感人物的肖象權,內文以川普換與拜登做為例子。
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
在 Stable Diffusion 中有時人物的大小遠近好像很隨機,除了用 ControlNet 其實可以利用 prompt 輸入 拍攝電影的鏡頭控制術語用來控制距離及角度。
Thumbnail
Getty Images推出AI圖像生成工具,與Nvidia合作保障版權 圖片供應商Getty Images日前宣布,將與晶片大廠Nvidia合作,推出名為「Generative AI by Getty Images」的AI圖像生成工具。該工具運用了Getty Images豐富的授權圖片資料庫
Thumbnail
中二病少女這次去了外星球,化身複製人大軍,身穿帝國的暴風兵裝備,這次一樣用realistic fantasy模型,再搭配其他的(你知道的專作瑟瑟圖的那種模型)試試看效果,去呈現荒涼外星球的戰鬥。但星際大戰的光劍始終都很怪很可笑,等下可以看。 這次表情沒下提示詞連笑都不笑,同伴倒下也呈現呆滯狀,表現的
Thumbnail
本文探討了反向詞(Negative Embedding)的概念,並介紹了在 Stable Diffusion WebUI 中使用的幾種模型,包括 EasyNegative、bad_prompt_version2、bad-hands-5 和 Deep Negative V1.x。這些模型的主要目的是在
Thumbnail
txt2img 時,會用 512、768 等等大小來測試算圖,反覆迭代找到一個適合的 prompt 和參數組合。如果想要以此組合算出高解析度的圖片,直接調整長寬會遇到畫面跑掉的問題。該如何在固定構圖的情況下增加圖片的解析度呢?本文提供三個方法讓大家嘗試看看!
Thumbnail
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
Thumbnail
本教學使用Automatic 1111介面   AI繪圖風行至今,網上已有不少中文教學,包括教導如何訓練LoRA、LoCon等模型的文章,而訓練上述模型時,通常會經過一道「Preprocess Images」工序,中文稱為「圖片預處理」。
Thumbnail
stable diffusion 是一款AI繪圖軟體,你可以免費把stable diffusion算出來的圖免費拿來商用,但是像我的電腦因為顯卡太舊而無法快速運行,而浪費很多時間,你只要準備一個google帳號即可。