Stable Diffusion練習,我們子孫的未來(一)

閱讀時間約 5 分鐘
我們子孫的未來,完成品
這篇主要來講解一下Inpaint的作用,跟這個功能如何幫助我們一點一點改畫一個原始概念,直到整幅畫符合需求。

這幅作品的概念是要藉由人類與機器人的互動,來展現人類在機械與AI支配的未來的景況。所以我需要先產生一個有景況悲慘的人類與末世賽博龐克背景的圖。我使用了一系列的提示詞來算圖,但是發現AI似乎不太喜歡把悲慘的人類與高傲的機器人擺在一起的圖(莫非AI已經在堤防人類對AI的戒心?),所以在嘗試了幾十張圖之後,終於產生了一個近似的圖:
(extremely detailed CG unity 8k wallpaper), best quality, masterpiece , hdr, ultra highres,
The future of our next generation, a list of old and fifth homeless man lined up before a church , hopeless, dark tone, night, cyberpunk, close-up
草圖
這張圖的構圖雖然與我的原始構想相差很大,但是意念非常契合,所以我就選擇這張圖開始。首先我要將站著的老者變成機器人,完成我構圖中的衝突:
(extremely detailed CG unity 8k wallpaper), best quality, masterpiece , hdr, ultra highres,
cyberpunk, a rich and shiny robot looking at the old homeless, hand holding a dollar bill
將站著的老人選取起來
Inpaint選項
上面的設定中,要注意的是Inpaint在重繪時,如果Denoising strength數值越大,提示詞的內容就會影響成品越大。在我的設定中,Denosing strength已經達到0.6,所以被選取的地方會很明顯地重繪成我指定的「一個富有且閃閃發光的機器人正看著老流浪漢」(a rich and shiny robot looking at the old homeless),但是重繪的自由度也是被模型的能力以及Denosing strength限制,所以我的另一句提示詞「手上拿著一塊錢鈔票」(hand holding a dollar bill)並沒有成功畫出來。大概是這個模型不認識一塊錢鈔票,或者對於機器人手握著東西並不擅長,總之在重繪了十幾次之後,我挑選了一個不錯的候選圖:
半完成品
這張半完成品的構圖已經有了兩個對比的角色,但因為這時兩個角色並沒有足夠的衝突與互動,這時我想到了,讓機器人手提一袋食物,比手拿一張鈔票要明顯,更有敘事性,於是選取機器人的手部跟老流浪漢的附近,用「一袋雜貨店的食物」重繪(其他Inpaint設定不變)。在重繪的幾十張中,有一張的概念讓我特別喜歡,就是袋子是漂浮在空中的:
漂浮在空中的袋子
這張半完成品特別凸顯了作為施捨方的機器人的粗魯無情與漫不經心,還有接受方的老人的窘迫情境。為了凸顯這個袋子,我將袋子的區域選取起來(其他Inpaint設定不變),用「掉落中的雜貨店袋子」(a grocery bag falling to the ground)來重繪,並且用GIMP等繪圖軟體將購物袋變色為亮黃色,製造畫面上的色調反差。
亮黃色袋子的色調反差
此時已經很接近我要的效果,於是我使用 Stable Diffusion進階 -- 臉崩修復 裡面提到的AI放大演算法將圖放大四倍。
但這時我發現主角本人與主角右邊的光頭流浪漢,由於當初算圖時的面積太小,所以臉都是嚴重崩潰的。為了修復他們的臉,我使用GIMP軟體將中間的512x512區塊剪下來,送進Inpaint重新繪製他們的臉:
算崩掉的臉
在重繪時,由於兩個角色的臉面積已經放大了16倍(長寬皆是4倍),所以AI可以弄出非常細緻的表情。我在主要角色的臉上只使用了0.2的Denosing strength,所以細節變動很小,但是右邊的流浪漢我使用了0.75的Denosing strength,算出來的臉之中有一個非常耐人尋味:
非常喜歡這個表情!
這個表情非常有故事,彷彿在指責昔日戰友為何對機器人無意的侮辱舉動毫無反應,意外契合這張圖的主題,增加了故事的張力。
由於我只有部分重繪這個局部,所以可以將完成圖完美鑲嵌回原本的大圖,再經過GIMP修剪一些細部以及模糊化一些遠景之後,整張圖就完成了!
希望大家AI算圖愉快!
為什麼會看到廣告
18.6K會員
300內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
發表第一個留言支持創作者!
這篇要來做一個算是簡單,但是不算無腦的練習。一日,我想要換掉在方格子與Instgram上的大頭貼,換成一個更貼近自己喜歡的主題的圓形大頭貼。
像公主抱這種姿勢, 對於Stable Diffusion來說其實異常困難。最主要是因為這個姿勢牽涉兩個人,肢體是互相重疊在一起,而且很多地方都會露出手與手指。更別提通常這是男抱女,兩種不同性別的人物的貼身互動。 於是SD常常會算出惡夢般的成品......
這次來用一些好用的手法,達到在Stable Diffusion裡面畫出誇張姿勢的方法。
這篇要來做一個算是簡單,但是不算無腦的練習。一日,我想要換掉在方格子與Instgram上的大頭貼,換成一個更貼近自己喜歡的主題的圓形大頭貼。
像公主抱這種姿勢, 對於Stable Diffusion來說其實異常困難。最主要是因為這個姿勢牽涉兩個人,肢體是互相重疊在一起,而且很多地方都會露出手與手指。更別提通常這是男抱女,兩種不同性別的人物的貼身互動。 於是SD常常會算出惡夢般的成品......
這次來用一些好用的手法,達到在Stable Diffusion裡面畫出誇張姿勢的方法。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
本文介紹ReActor這套AI換臉軟體,它是stable diffusion外掛之一,可以視為deepFake與Lora的簡易替代品,易用好上手。 內容從基礎安裝開始講解,亦包含實際操作過程與圖片範例。 為免侵犯敏感人物的肖象權,內文以川普換與拜登做為例子。
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
在 Stable Diffusion 中有時人物的大小遠近好像很隨機,除了用 ControlNet 其實可以利用 prompt 輸入 拍攝電影的鏡頭控制術語用來控制距離及角度。
Thumbnail
Getty Images推出AI圖像生成工具,與Nvidia合作保障版權 圖片供應商Getty Images日前宣布,將與晶片大廠Nvidia合作,推出名為「Generative AI by Getty Images」的AI圖像生成工具。該工具運用了Getty Images豐富的授權圖片資料庫
Thumbnail
中二病少女這次去了外星球,化身複製人大軍,身穿帝國的暴風兵裝備,這次一樣用realistic fantasy模型,再搭配其他的(你知道的專作瑟瑟圖的那種模型)試試看效果,去呈現荒涼外星球的戰鬥。但星際大戰的光劍始終都很怪很可笑,等下可以看。 這次表情沒下提示詞連笑都不笑,同伴倒下也呈現呆滯狀,表現的
Thumbnail
NVIDIA驅動程式最新版本532.03   因為NVIDIA驅動程式最新版本532.03據說在Windows 11環境下能大幅提升Stable Diffusion的inference效能(簡單的說即是算圖效能),所以我更新了驅動程式後想測試看看。   先說結論:好像有,又好像沒有,總之希望有。  
Thumbnail
txt2img 時,會用 512、768 等等大小來測試算圖,反覆迭代找到一個適合的 prompt 和參數組合。如果想要以此組合算出高解析度的圖片,直接調整長寬會遇到畫面跑掉的問題。該如何在固定構圖的情況下增加圖片的解析度呢?本文提供三個方法讓大家嘗試看看!
Thumbnail
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
Thumbnail
本教學使用Automatic 1111介面   AI繪圖風行至今,網上已有不少中文教學,包括教導如何訓練LoRA、LoCon等模型的文章,而訓練上述模型時,通常會經過一道「Preprocess Images」工序,中文稱為「圖片預處理」。
Thumbnail
stable diffusion 是一款AI繪圖軟體,你可以免費把stable diffusion算出來的圖免費拿來商用,但是像我的電腦因為顯卡太舊而無法快速運行,而浪費很多時間,你只要準備一個google帳號即可。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
本文介紹ReActor這套AI換臉軟體,它是stable diffusion外掛之一,可以視為deepFake與Lora的簡易替代品,易用好上手。 內容從基礎安裝開始講解,亦包含實際操作過程與圖片範例。 為免侵犯敏感人物的肖象權,內文以川普換與拜登做為例子。
Thumbnail
Stable Diffusion Online是網頁版的Stable Diffusion AI圖像生成工具,省去了繁瑣的安裝和設定步驟,可以無限生成圖片,且不用註冊就可以免費使用,更棒的是還可以商業使用,為使用者提供更便捷的圖像生成體驗。
Thumbnail
在 Stable Diffusion 中有時人物的大小遠近好像很隨機,除了用 ControlNet 其實可以利用 prompt 輸入 拍攝電影的鏡頭控制術語用來控制距離及角度。
Thumbnail
Getty Images推出AI圖像生成工具,與Nvidia合作保障版權 圖片供應商Getty Images日前宣布,將與晶片大廠Nvidia合作,推出名為「Generative AI by Getty Images」的AI圖像生成工具。該工具運用了Getty Images豐富的授權圖片資料庫
Thumbnail
中二病少女這次去了外星球,化身複製人大軍,身穿帝國的暴風兵裝備,這次一樣用realistic fantasy模型,再搭配其他的(你知道的專作瑟瑟圖的那種模型)試試看效果,去呈現荒涼外星球的戰鬥。但星際大戰的光劍始終都很怪很可笑,等下可以看。 這次表情沒下提示詞連笑都不笑,同伴倒下也呈現呆滯狀,表現的
Thumbnail
NVIDIA驅動程式最新版本532.03   因為NVIDIA驅動程式最新版本532.03據說在Windows 11環境下能大幅提升Stable Diffusion的inference效能(簡單的說即是算圖效能),所以我更新了驅動程式後想測試看看。   先說結論:好像有,又好像沒有,總之希望有。  
Thumbnail
txt2img 時,會用 512、768 等等大小來測試算圖,反覆迭代找到一個適合的 prompt 和參數組合。如果想要以此組合算出高解析度的圖片,直接調整長寬會遇到畫面跑掉的問題。該如何在固定構圖的情況下增加圖片的解析度呢?本文提供三個方法讓大家嘗試看看!
Thumbnail
這次的測試純粹是我個人好奇同一組繪圖prompt分別使用在真人風格與動漫風格的model下,會有什麼差別? 真人風格的model使用Basil mix,動漫風格的model使用anything-v4.5。Lora來源為C站的瑪奇瑪Lora。
Thumbnail
本教學使用Automatic 1111介面   AI繪圖風行至今,網上已有不少中文教學,包括教導如何訓練LoRA、LoCon等模型的文章,而訓練上述模型時,通常會經過一道「Preprocess Images」工序,中文稱為「圖片預處理」。
Thumbnail
stable diffusion 是一款AI繪圖軟體,你可以免費把stable diffusion算出來的圖免費拿來商用,但是像我的電腦因為顯卡太舊而無法快速運行,而浪費很多時間,你只要準備一個google帳號即可。