AI算圖,Stable Diffusion的頭一個月

更新於 2024/01/10閱讀時間約 4 分鐘

MidJourney

整整一個月前,我開始接觸AI繪圖,  那時候用的是免費的MidJourney帳號,我產生的第一個圖的提示詞只花了我半個小時摸索,MJ就產生了這張圖:
MidJourney 第一張成品
當我第一眼見到成品,我必須承認我傻眼了,這AI繪圖的功力也太厲害了吧!當下開始不停找關鍵字算圖,直到我把免費的半小時算力都用光為止,到那時我已經能算出這樣的圖了:
最後一張MidJourney的圖
這樣的體驗讓我大為震驚,沒想到毫無美術能力,最多只會用微軟小畫家畫火柴人的我,居然也能靠著AI算出這種等級的圖!

Stable Diffusion

當我內心掙扎著要不要花錢買MJ會員的時候,一直瀏覽各種現有的電腦算圖方案,想找到一個不用花錢的AI算圖方案,結果很快就發現了鼎鼎大名的Stable Diffusion,不得不說免費的最吸引人,只要自己的機器顯卡夠力,能限制作品質量的只剩電費、一天二十四小時,以及想像力。
我的Stable Diffusion初體驗始於從Civitai.com上抓下順眼的模組後,直接套作者推薦的提示詞後修改幾個字,跑出來的圖比當初MidJourney帶給我的震撼還大:
Stable Diffusion第一批成品
如果說MidJourney帶給我的是AI算圖的能力,那Stablee Diffusion讓我知道了AI算圖不只是有趣的玩具,而是真的有專業實力的工具。(前提是,如果你調對參數,下對提示詞的話)
之後,我電動也不打了,書也不看了,有空就開Stable Diffusion,把自己想得到,看到的提示詞打進去刷個幾十張圖來挑,套句Reddit網友的話,AI算圖其實就是一個免費的抽卡遊戲,抽多了總能抽到自己最愛的SSR卡。
我也在這遊戲裡面看到了我心儀的角色,這時,一股想要複製她在各種場景探險的,看看她在其他不同模組會長得什麼樣的想法油然而生,這時,我知道是時候探險一些進階的技巧了:
第一個想製成LoRA的角色
在開始烘焙LoRA之前,我想要先來鍛鍊一些很重要但有點困難的技巧。鍛鍊技巧最好的方法就是實踐一直在腦海中縈繞,但以前畫技不足沒辦法表現出來的畫面。
於是我在家附近照了一張樹木的近照,準備從這個地方開始,練習各種SD的基本技巧,目標就是重現我最想畫出來的場景:
第一次用各種技巧產出我腦海中的畫面
第一次操作各種功能,例如inpaint,outpaint,img2img,upscaling,這才發現AI算圖沒那麼簡單,很多時候我們與AI的關係比較像是:
AI就是小小兵!
你給他們一個指令,但是結果不保證是你要的,更多時候是很恐怖的東西,像是合成獸、三頭六臂、香腸手指、畢卡索或者全部都有。很多時候試了十幾次才給你一個正常點的東西。但是,有時候下對了,就可以給你一些真正的驚喜,例如:
沒有使用任何LoRA也能跑出這種圖

LoRA

當我收完足夠的圖,就開始第一次LoRA訓練,成果都寫在
而訓練出來的LoRA效果讓我非常滿意,甚至讓我抽到非常稀有的姿勢:
千中抽一的SSR卡
讚嘆AI啊,我非常相信,就算專業畫手不需要AI算圖來幫他們代筆,提供靈感與構圖對他們也是很好用的。
有了一次經驗之後,接下來想要做出自己一直想要畫出來的角色就快多了。當角色在腦海裡的醞釀的時候,通常都是一副模糊的畫面,直到AI產出來的圖與你腦內的形象有了一點類似之後,就會越來越清晰,下出的提示詞就能一步步逼近,又或者釐清了某些自己沒想到的細節,讓AI幫你找路找出各種組合,挑選自己最喜歡的,或許這就是AI創作的美妙之處。
你就像多了一個勤奮孜孜不倦的副手,你負責出主意,它負責生出一百個成果讓你繼續發想,它不會累,不吃不喝不佔空間不需要勞健保,也不會抱怨,更不會嘲笑你(你嘲笑它的時候還比較多)。
最後你們一起踏上那個夢想中的山巔
連表情都是我要的
第二次烘焙LoRA我用了更穩健的方法,出來的結果適應性更高,套在我所有用過的模組上,幾乎都沒有讓背景崩壞,或者讓人物在原先模組上的筆觸滲透進其他模組:

結語

一個月的探險,從一個白衣女子在森林中騎馬開始,那就用同一個意念來做出一樣的姿態,但是用一個月所學的技巧,讓它更貼近我腦海中的感覺吧:
月夜,在林中獨行的女子
祝大家AI算圖愉快!
即將進入廣告,捲動後可繼續閱讀
為什麼會看到廣告
avatar-img
21.6K會員
364內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
就算是跑到白雪靄靄的高山地帶,冷得要死,但是我們的Cosplayer依舊敬業地演出 ,一句怨言也沒有 ! 風景很好,但是我想我下次不會來這裡拍了。
位在綠樹森林入口迎接旅客的,就是著名的「淚河巨人」。 傳說在奧夫卡帝國終於攻破綠樹森林的毒瘴,擊殺綠樹妖精的守護者,將整個種族奴役時,這棵巨樹樹幹開始流下奔騰的瀑布。
就算是跑到白雪靄靄的高山地帶,冷得要死,但是我們的Cosplayer依舊敬業地演出 ,一句怨言也沒有 ! 風景很好,但是我想我下次不會來這裡拍了。
位在綠樹森林入口迎接旅客的,就是著名的「淚河巨人」。 傳說在奧夫卡帝國終於攻破綠樹森林的毒瘴,擊殺綠樹妖精的守護者,將整個種族奴役時,這棵巨樹樹幹開始流下奔騰的瀑布。
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
最近有很多美國的客戶想了解AI運算造成的電力需求大幅提升, 對產業或股價的影響?是否有一些基本的根據來計算, 得出對電力股的股價合理估值在哪裡?
Thumbnail
2022年11月30日,ChatGPT的登場對全球造成了顯著衝擊。隨後,2024年2月15日,OpenAI發布了能夠將文字轉換為圖像的AI模型SORA,這一創新再次引發了巨大的震動。 這兩大創新引發的全球算力需求的增長幅度是前所未有的。 需求的瞬間迅猛增長,但供應的增加卻需要更長的時間。Nv
Thumbnail
本篇分享整理一些我自己常用的,基礎的寫prompt起手勢,記得要根據應用後的測試結果跟個人需求來調整。 希望每個走過路過的朋友,在看完後經過練習,都可以找到自己寫prompt的風格。
Thumbnail
本篇面向AI算圖新手、對寫prompt沒有概念的朋友,以diffusion model系AI繪圖工具為例,分享我自己從零開始學習寫圖像生成prompt的經驗,只談基本架構跟新手上路的方向。 希望每個走過路過的朋友,在看完後經過練習,都可以找到自己寫prompt的風格。
Thumbnail
前陣子格友 Vanessa 展示了 美圖秀秀軟體,AI 算圖的功能 (個人不覺得那是畫圖),文章連結如下: 手繪與AI繪畫|美圖秀秀軟體 關於 AI 的思考,Beta 更早之前,已經有完整論述: 我們 與 國道收費員 的距離 就算,Beta 千呼萬喚,提醒大家思考 AI 的衝擊,但無可奈何,公司也
Thumbnail
(2023/4/16) 聽完‎在 Apple Podcasts 上的《財報狗 - 掌握台股美股時事議題》:205.【財經時事放大鏡】NVIDIA GTC 與美國晶片法 Q: 為何語言要大量訓練深度學習不是用擅長複雜運算/電晶體密度也較高的CPU? 其實也不了解GPU/CPU的差異關鍵在哪? A:(f
Thumbnail
以下講一些有關stable diffusion webui的幾個小操作,都不難,也都很實用,也許其實你早就知道了,這些都不是什麼驚奇的事,但我發現似乎並不是所有人都知道這些事。 這些真的都是一些雞毛蒜皮的小事,不足以獨立寫成一篇教學文章,所以我就簡單的匯整一下就好。
Thumbnail
這篇主要是比較目前在stable diffusion webui下的20種採樣方式的圖片生成速度與生成結果比較。此處所說的採樣即是Sampling method,也有的會翻成取樣方法。
Thumbnail
雖然不是完全沒有競爭者,但基本上,在資料中心端的AI 運算處理器中,NVIDIA 可以說是在市場上佔據壟斷性的地位。也就是說,如果未來幾年,科技產業的重點是各家巨頭與新創獨角獸之間的 AI 大戰的話,那 NVIDIA 就是這場戰爭背後,最大的軍火供應商。
Thumbnail
各種不同的構圖方式,以及不同特寫程度的角色畫面,再到畫面中人物呈現的數量差別。
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
最近有很多美國的客戶想了解AI運算造成的電力需求大幅提升, 對產業或股價的影響?是否有一些基本的根據來計算, 得出對電力股的股價合理估值在哪裡?
Thumbnail
2022年11月30日,ChatGPT的登場對全球造成了顯著衝擊。隨後,2024年2月15日,OpenAI發布了能夠將文字轉換為圖像的AI模型SORA,這一創新再次引發了巨大的震動。 這兩大創新引發的全球算力需求的增長幅度是前所未有的。 需求的瞬間迅猛增長,但供應的增加卻需要更長的時間。Nv
Thumbnail
本篇分享整理一些我自己常用的,基礎的寫prompt起手勢,記得要根據應用後的測試結果跟個人需求來調整。 希望每個走過路過的朋友,在看完後經過練習,都可以找到自己寫prompt的風格。
Thumbnail
本篇面向AI算圖新手、對寫prompt沒有概念的朋友,以diffusion model系AI繪圖工具為例,分享我自己從零開始學習寫圖像生成prompt的經驗,只談基本架構跟新手上路的方向。 希望每個走過路過的朋友,在看完後經過練習,都可以找到自己寫prompt的風格。
Thumbnail
前陣子格友 Vanessa 展示了 美圖秀秀軟體,AI 算圖的功能 (個人不覺得那是畫圖),文章連結如下: 手繪與AI繪畫|美圖秀秀軟體 關於 AI 的思考,Beta 更早之前,已經有完整論述: 我們 與 國道收費員 的距離 就算,Beta 千呼萬喚,提醒大家思考 AI 的衝擊,但無可奈何,公司也
Thumbnail
(2023/4/16) 聽完‎在 Apple Podcasts 上的《財報狗 - 掌握台股美股時事議題》:205.【財經時事放大鏡】NVIDIA GTC 與美國晶片法 Q: 為何語言要大量訓練深度學習不是用擅長複雜運算/電晶體密度也較高的CPU? 其實也不了解GPU/CPU的差異關鍵在哪? A:(f
Thumbnail
以下講一些有關stable diffusion webui的幾個小操作,都不難,也都很實用,也許其實你早就知道了,這些都不是什麼驚奇的事,但我發現似乎並不是所有人都知道這些事。 這些真的都是一些雞毛蒜皮的小事,不足以獨立寫成一篇教學文章,所以我就簡單的匯整一下就好。
Thumbnail
這篇主要是比較目前在stable diffusion webui下的20種採樣方式的圖片生成速度與生成結果比較。此處所說的採樣即是Sampling method,也有的會翻成取樣方法。
Thumbnail
雖然不是完全沒有競爭者,但基本上,在資料中心端的AI 運算處理器中,NVIDIA 可以說是在市場上佔據壟斷性的地位。也就是說,如果未來幾年,科技產業的重點是各家巨頭與新創獨角獸之間的 AI 大戰的話,那 NVIDIA 就是這場戰爭背後,最大的軍火供應商。
Thumbnail
各種不同的構圖方式,以及不同特寫程度的角色畫面,再到畫面中人物呈現的數量差別。