方格精選

Stable Diffusion練習,漫畫,姊妹會秘儀

更新於 發佈於 閱讀時間約 9 分鐘
第一頁草稿與成品對比

前言

本篇要來分享一下製作 (漫畫)姊妹會秘儀 -- Stable Diffusion繪製 時用到的各種AI生成技巧。
很多時候,為了將心中一個想法實現,必須用上許多自己原先不會的技巧,雖然過程是痛苦的、掙扎的,但是這樣一點一滴邁向終點,過程之中會慢慢進化,當到達時,就會發現收穫的不只是成果,還有一路上學到的新技能。
一個多月前實驗一個想法時,偶然刷到了一張稀有等級的構圖。當我看見那張圖的瞬間,一大篇小說的草稿就從我腦海深處浮現出來,甚至某些畫面就栩栩如生在我眼前展開,靈光一閃之際,暗自決定要將其中一些片段當作練習,試著將它做成漫畫形式。
在三個月之前,美術能力為零,作畫上限是火柴人的我而言,實現難度是無限大,實現時間是無限長。但是在AI算圖的時代,從技術準備加摸索,總共是一個月,實作時間是六個小時。在這個時代,想做出漫畫但繪畫技巧為零的人是幸福的。

第二頁

第二頁,姊妹會秘儀,完成版
故事要從第二頁開始,在實驗 Stable Diffusion提示詞訣竅(九) 提到的狂野生圖法時,使用提示詞storyboard(電影分鏡)時偶然刷到了超稀有等級的圖片。雖然剛出現時,所有角色的臉都是崩的(其實是連一張完整的臉都沒有),但是經過放大與臉崩修復之後,整個氣勢就出來了。角色們的表情與整體氛圍都在敘述一個故事。
為了講述這個故事,我用我極為有限的繪畫能力畫了一張銜接這個關鍵格的一頁草稿,就是文章開頭那張筆記本頁面上的火柴人分鏡稿。
為了實現這一頁所需要的技術,我根本就還不具備,為了搞清楚到底如何使用AI來將這一頁做出來,我邊看關於如何畫漫畫的文章與影片,邊摸索如何使用AI與簡單的繪圖軟體來製造一個能看的成品。
在這一個月之中,我寫的AI學習心得文之中,十篇裡面有七篇是為了這個目標有方向地研究。終於讓我覺得有一套可行的方法與技術可以把它做出來。
首先是第二頁的打磨,將圖放大兩倍再使用 Stable Diffusion進階 -- 臉崩修復 來修復每個人物的臉之後,繼續放大兩倍。這時候還有許多細節需要打磨,但因為整張圖已經太大,無法一次塞進Automatic1111裡面處理,所以我需要使用繪圖軟體將圖片分區剪裁,每區為包含一個人物的768x1024長條圖,一區一區餵進Automatic1111之後,Inpaint中央部分的臉、頭髮與胸部之後再拼接回原圖,這樣才能保證重繪的地方不會讓拼接圖出現銜接縫。

第一頁

而為了將第一頁從草稿變成漫畫稿,花費的時間比第二頁多了幾十倍
首先,要解決Stable Diffusion或甚至可說整個AI繪圖目前最大的問題:角色不穩定性。Stable Diffusion的解決方法是使用LoRA來為人物訓練專屬的小模型,但在這邊有個難題,就是我只有一張圖,而訓練LoRA需要用到最少二十張圖才有穩定的品質。幸好這問題在ControlNet的Reference模型出來之後就迎刃而解囉。
第一頁第一格,芙悠
我找出了一個可以用單張高畫質圖片來訓練動畫角色LoRA的方法,詳細流程寫在了 Stable Diffusion -- 訓練LoRA(五) 裡面,並用這個方法替第一頁的主要角色訓練了LoRA,這樣就能在每一格都重現同一個人物。
接下來的第二格則是另一個問題,那就是大部分的ACG與2.5D模型都有的通病——光源太亮,而這整個故事的場景都是在夜晚,而且是穩定光源非常昂貴的中古背景奇幻世界,除了使用繪圖軟體調暗亮度,並且手刻光影之外,另一個可行且有趣的方法就是指示AI如何用我指定的光源塗佈畫面。
第一頁第二格,哈娜
Stable Diffusion進階 -- 光影控制 裡面,我發覺一個我原本覺得華而不實,純粹展示技巧的技術其實在這種場合非常有用,就是使用遮罩引導AI分配光線。我用下面的黑白遮罩引導AI在圖片右方做出唯一的光源,搭配上ControlNet的Openpose與Depth維持人物的姿勢與深淺做出第二格。
光源參考遮罩
但是出來的半完成品中,人物的左右衣袖原本都是紅色的,試了幾個方法之後,最後我用了 Stable Diffusion基礎 -- 塗鴉(Sketch) 裡提到的Inpaint Sketch功能塗白整條手臂再重繪,這樣才順利將她的服裝變成全白棉質。所以,不管當初學到的時候覺得這個技能有多無用,只要會用,知道使用的時機,就沒有廢技。
再來就是我花最多時間處理的第三格。AI算圖的另一個大問題是,它無法穩定維持在同一套衣服上,尤其是很多漂亮複雜的衣服其實沒有合適的提示詞來形容。這時候Inpaint就發揮了非常、非常重要的功能。
第一頁第三格,芙悠背影
Stable Diffusion基礎 -- 局部重繪的應用 裡面,四種不同的Mask Content都是用同一個圖,也就是芙悠穿著晚禮服走上樓梯的第三格來當示範,因為這就是我學習Inpaint不同參數的動力來源,想要將草稿的動態與背景做出成品的願望激勵著我。我使用Inpaint的不同選項做了以下修改:
  • Fill:將左右完全不一致的樓梯重繪成了正常的樓梯。
  • Original:將禮服的背面材質置換成與第二頁一致的藍色星星紗,同時保持了裸背的晚禮服形狀。
  • Latent Nothing:將晚禮服臀部上的多餘金邊裝飾移除掉,同時保持原本的光影與曲線。
使用Inpaint處理這些部分之後,剩下的服裝不一致只能靠繪圖軟體自己想辦法剪貼拼裝上之後再用img2img來重繪光影,並且讓浮浮的拼貼裝飾(頭飾,臂環)貼回人體身上。
而人物被算壞掉的左手,則是使用 Stable Diffusion進階 -- 手部修復 提到的方法,在人偶姿勢網站做出一樣的手,再拼接回原圖之後用Inpaint修復。
這些都完成之後,製作漫畫的素材就到齊了,剩下的就是用繪圖軟體將圖拼接起來,製作頁面、框線、陰影與對話框,這就超出本文的範圍了。

翻譯

講一個題外話,在我寫中文台詞時,其實是先在腦海產生英文的台詞,再轉成中文寫下來,這樣比較不會讓西方奇幻背景的故事有太重的中文味。但是在製作漫畫的英文台詞時,我並沒有直接使用當初的台詞,而是把中文版的台詞拿去詢問ChatGPT,沒想到ChatGPT產生出來的英文台詞非常好,遠超過我自己想的英文原台詞。只需要一些簡單提示,ChatGPT就能做出合理的翻譯,且翻出好幾個版本讓我選擇,我在數個版本之間挑選最符合角色的個性、知識程度與出身階級的段落,拼接重整之後得到了可以用在漫畫裡的版本。
我在ChatGPT使用的提示文字是:
一篇短篇小說中的對話,有兩名角色,哈娜(Hana)與芙悠(Fuyu),一個民族名稱,泰洛斯(Thelos),將以下這段小說內文翻譯成英文:
我相信日後只要提供更詳細的背景設定提示詞,ChatGPT就能為我提供更精細的翻譯,但是目前這樣簡單的提示詞就足夠幫助我完成兩頁英文版的翻譯了。

結語

做完這個短短兩頁的漫畫,有一種不可思議的感覺,畢竟這種事情在AI時代之前是壓根就不可能實現的。但是現在,一切都有可能。只是需要一些些繪圖軟體的使用技巧,還有很多的AI算圖知識,加上試錯的時間與結合不同技術的創意,就有辦法達到。
在這個時代,想做出美麗圖畫但畫技為零的人是幸福的。
祝大家AI算圖愉快!至少,我是痛並快樂著。
為什麼會看到廣告
avatar-img
22.4K會員
411內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
這篇要來示範將幾個AI算圖技巧綜合起來之後,如何得到「草地唸書」的完成圖。
這篇主要來講解一下Inpaint的作用,跟這個功能如何幫助我們一點一點改畫一個原始概念,直到整幅畫符合需求。 這幅作品的概念是要藉由人類與機器人的互動,來展現人類在機械與AI支配的未來的景況。
這篇要來做一個算是簡單,但是不算無腦的練習。一日,我想要換掉在方格子與Instgram上的大頭貼,換成一個更貼近自己喜歡的主題的圓形大頭貼。
像公主抱這種姿勢, 對於Stable Diffusion來說其實異常困難。最主要是因為這個姿勢牽涉兩個人,肢體是互相重疊在一起,而且很多地方都會露出手與手指。更別提通常這是男抱女,兩種不同性別的人物的貼身互動。 於是SD常常會算出惡夢般的成品......
這次來用一些好用的手法,達到在Stable Diffusion裡面畫出誇張姿勢的方法。
這篇要來示範將幾個AI算圖技巧綜合起來之後,如何得到「草地唸書」的完成圖。
這篇主要來講解一下Inpaint的作用,跟這個功能如何幫助我們一點一點改畫一個原始概念,直到整幅畫符合需求。 這幅作品的概念是要藉由人類與機器人的互動,來展現人類在機械與AI支配的未來的景況。
這篇要來做一個算是簡單,但是不算無腦的練習。一日,我想要換掉在方格子與Instgram上的大頭貼,換成一個更貼近自己喜歡的主題的圓形大頭貼。
像公主抱這種姿勢, 對於Stable Diffusion來說其實異常困難。最主要是因為這個姿勢牽涉兩個人,肢體是互相重疊在一起,而且很多地方都會露出手與手指。更別提通常這是男抱女,兩種不同性別的人物的貼身互動。 於是SD常常會算出惡夢般的成品......
這次來用一些好用的手法,達到在Stable Diffusion裡面畫出誇張姿勢的方法。
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
研究AI生成美女圖像 研究AI生成美女圖像是一個很有趣的方向,特別是對於喜歡速寫但很少畫美女的我來說。AI生成圖像的技術不僅可以幫助創作出我心中所想的形象,還可以作為靈感的來源,讓我在速寫中嘗試新的風格和主題。 基於大量的數據訓練 AI生成的圖像通常基於大量的數據訓練,可以創造出各種不同風格和
Thumbnail
來看看如何使用AI詠唱的方式,生成需要的雜誌畫面,並對比實際平面模特兒拍攝的照片,變換風格或是指定地區,來看看每一段描述的改變,會產生出什麼樣的變化。
Thumbnail
生成式AI工具即將邁入三年,除了ChatGPT以外,也進化了許多GenAI工具,如Sora影片生成等。 你知道Stable Diffusion嗎? 從詠唱魔法師Prompts的玩家或職務,AI浪潮持續推進下,SD-WebUI並沒有停滯或被淘汰。 結果告訴了我們一件事情...
Thumbnail
介紹如何使用AI生成圖像的五個步驟,包括選擇主題、強化主角形象、使用ChatGPT輸入提示句子、AI生成圖像工具生成、以及使用增強畫質的生成工具。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
主題介紹:Comic AI是一款創新的AI工具,專為喜愛漫畫和敘事的創作者而設計。這個網頁工具運用最先進的人工智慧技術,為用戶提供一個直觀而強大的平台,讓他們能夠輕鬆地創作和分享自己的漫畫故事。不論你是專業的插畫師還是漫畫愛好者,Comic AI都能夠協助你將想法轉化為視覺藝術作品。利用其用戶友
Thumbnail
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Thumbnail
我問了前陣子使用Ai下達指令畫圖的妹妹,怎麼下達比較清楚?我妹妹說「指令需要以單詞為主,比較容易判讀」於是我開始改變方向下達了第 一個指令,終於出現第一個比較正常的圖像。
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
研究AI生成美女圖像 研究AI生成美女圖像是一個很有趣的方向,特別是對於喜歡速寫但很少畫美女的我來說。AI生成圖像的技術不僅可以幫助創作出我心中所想的形象,還可以作為靈感的來源,讓我在速寫中嘗試新的風格和主題。 基於大量的數據訓練 AI生成的圖像通常基於大量的數據訓練,可以創造出各種不同風格和
Thumbnail
來看看如何使用AI詠唱的方式,生成需要的雜誌畫面,並對比實際平面模特兒拍攝的照片,變換風格或是指定地區,來看看每一段描述的改變,會產生出什麼樣的變化。
Thumbnail
生成式AI工具即將邁入三年,除了ChatGPT以外,也進化了許多GenAI工具,如Sora影片生成等。 你知道Stable Diffusion嗎? 從詠唱魔法師Prompts的玩家或職務,AI浪潮持續推進下,SD-WebUI並沒有停滯或被淘汰。 結果告訴了我們一件事情...
Thumbnail
介紹如何使用AI生成圖像的五個步驟,包括選擇主題、強化主角形象、使用ChatGPT輸入提示句子、AI生成圖像工具生成、以及使用增強畫質的生成工具。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
主題介紹:Comic AI是一款創新的AI工具,專為喜愛漫畫和敘事的創作者而設計。這個網頁工具運用最先進的人工智慧技術,為用戶提供一個直觀而強大的平台,讓他們能夠輕鬆地創作和分享自己的漫畫故事。不論你是專業的插畫師還是漫畫愛好者,Comic AI都能夠協助你將想法轉化為視覺藝術作品。利用其用戶友
Thumbnail
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Thumbnail
我問了前陣子使用Ai下達指令畫圖的妹妹,怎麼下達比較清楚?我妹妹說「指令需要以單詞為主,比較容易判讀」於是我開始改變方向下達了第 一個指令,終於出現第一個比較正常的圖像。