AI算圖,Stable Diffusion的頭一個月

閱讀時間約 4 分鐘

MidJourney

整整一個月前,我開始接觸AI繪圖,  那時候用的是免費的MidJourney帳號,我產生的第一個圖的提示詞只花了我半個小時摸索,MJ就產生了這張圖:
MidJourney 第一張成品
當我第一眼見到成品,我必須承認我傻眼了,這AI繪圖的功力也太厲害了吧!當下開始不停找關鍵字算圖,直到我把免費的半小時算力都用光為止,到那時我已經能算出這樣的圖了:
最後一張MidJourney的圖
這樣的體驗讓我大為震驚,沒想到毫無美術能力,最多只會用微軟小畫家畫火柴人的我,居然也能靠著AI算出這種等級的圖!

Stable Diffusion

當我內心掙扎著要不要花錢買MJ會員的時候,一直瀏覽各種現有的電腦算圖方案,想找到一個不用花錢的AI算圖方案,結果很快就發現了鼎鼎大名的Stable Diffusion,不得不說免費的最吸引人,只要自己的機器顯卡夠力,能限制作品質量的只剩電費、一天二十四小時,以及想像力。
我的Stable Diffusion初體驗始於從Civitai.com上抓下順眼的模組後,直接套作者推薦的提示詞後修改幾個字,跑出來的圖比當初MidJourney帶給我的震撼還大:
Stable Diffusion第一批成品
如果說MidJourney帶給我的是AI算圖的能力,那Stablee Diffusion讓我知道了AI算圖不只是有趣的玩具,而是真的有專業實力的工具。(前提是,如果你調對參數,下對提示詞的話)
之後,我電動也不打了,書也不看了,有空就開Stable Diffusion,把自己想得到,看到的提示詞打進去刷個幾十張圖來挑,套句Reddit網友的話,AI算圖其實就是一個免費的抽卡遊戲,抽多了總能抽到自己最愛的SSR卡。
我也在這遊戲裡面看到了我心儀的角色,這時,一股想要複製她在各種場景探險的,看看她在其他不同模組會長得什麼樣的想法油然而生,這時,我知道是時候探險一些進階的技巧了:
第一個想製成LoRA的角色
在開始烘焙LoRA之前,我想要先來鍛鍊一些很重要但有點困難的技巧。鍛鍊技巧最好的方法就是實踐一直在腦海中縈繞,但以前畫技不足沒辦法表現出來的畫面。
於是我在家附近照了一張樹木的近照,準備從這個地方開始,練習各種SD的基本技巧,目標就是重現我最想畫出來的場景:
第一次用各種技巧產出我腦海中的畫面
第一次操作各種功能,例如inpaint,outpaint,img2img,upscaling,這才發現AI算圖沒那麼簡單,很多時候我們與AI的關係比較像是:
AI就是小小兵!
你給他們一個指令,但是結果不保證是你要的,更多時候是很恐怖的東西,像是合成獸、三頭六臂、香腸手指、畢卡索或者全部都有。很多時候試了十幾次才給你一個正常點的東西。但是,有時候下對了,就可以給你一些真正的驚喜,例如:
沒有使用任何LoRA也能跑出這種圖

LoRA

當我收完足夠的圖,就開始第一次LoRA訓練,成果都寫在
而訓練出來的LoRA效果讓我非常滿意,甚至讓我抽到非常稀有的姿勢:
千中抽一的SSR卡
讚嘆AI啊,我非常相信,就算專業畫手不需要AI算圖來幫他們代筆,提供靈感與構圖對他們也是很好用的。
有了一次經驗之後,接下來想要做出自己一直想要畫出來的角色就快多了。當角色在腦海裡的醞釀的時候,通常都是一副模糊的畫面,直到AI產出來的圖與你腦內的形象有了一點類似之後,就會越來越清晰,下出的提示詞就能一步步逼近,又或者釐清了某些自己沒想到的細節,讓AI幫你找路找出各種組合,挑選自己最喜歡的,或許這就是AI創作的美妙之處。
你就像多了一個勤奮孜孜不倦的副手,你負責出主意,它負責生出一百個成果讓你繼續發想,它不會累,不吃不喝不佔空間不需要勞健保,也不會抱怨,更不會嘲笑你(你嘲笑它的時候還比較多)。
最後你們一起踏上那個夢想中的山巔
連表情都是我要的
第二次烘焙LoRA我用了更穩健的方法,出來的結果適應性更高,套在我所有用過的模組上,幾乎都沒有讓背景崩壞,或者讓人物在原先模組上的筆觸滲透進其他模組:

結語

一個月的探險,從一個白衣女子在森林中騎馬開始,那就用同一個意念來做出一樣的姿態,但是用一個月所學的技巧,讓它更貼近我腦海中的感覺吧:
月夜,在林中獨行的女子
祝大家AI算圖愉快!
為什麼會看到廣告
18.8K會員
300內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
發表第一個留言支持創作者!
就算是跑到白雪靄靄的高山地帶,冷得要死,但是我們的Cosplayer依舊敬業地演出 ,一句怨言也沒有 ! 風景很好,但是我想我下次不會來這裡拍了。
位在綠樹森林入口迎接旅客的,就是著名的「淚河巨人」。 傳說在奧夫卡帝國終於攻破綠樹森林的毒瘴,擊殺綠樹妖精的守護者,將整個種族奴役時,這棵巨樹樹幹開始流下奔騰的瀑布。
就算是跑到白雪靄靄的高山地帶,冷得要死,但是我們的Cosplayer依舊敬業地演出 ,一句怨言也沒有 ! 風景很好,但是我想我下次不會來這裡拍了。
位在綠樹森林入口迎接旅客的,就是著名的「淚河巨人」。 傳說在奧夫卡帝國終於攻破綠樹森林的毒瘴,擊殺綠樹妖精的守護者,將整個種族奴役時,這棵巨樹樹幹開始流下奔騰的瀑布。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
最近有很多美國的客戶想了解AI運算造成的電力需求大幅提升, 對產業或股價的影響?是否有一些基本的根據來計算, 得出對電力股的股價合理估值在哪裡?
Thumbnail
2022年11月30日,ChatGPT的登場對全球造成了顯著衝擊。隨後,2024年2月15日,OpenAI發布了能夠將文字轉換為圖像的AI模型SORA,這一創新再次引發了巨大的震動。 這兩大創新引發的全球算力需求的增長幅度是前所未有的。 需求的瞬間迅猛增長,但供應的增加卻需要更長的時間。Nv
Thumbnail
本篇分享整理一些我自己常用的,基礎的寫prompt起手勢,記得要根據應用後的測試結果跟個人需求來調整。 希望每個走過路過的朋友,在看完後經過練習,都可以找到自己寫prompt的風格。
Thumbnail
本篇面向AI算圖新手、對寫prompt沒有概念的朋友,以diffusion model系AI繪圖工具為例,分享我自己從零開始學習寫圖像生成prompt的經驗,只談基本架構跟新手上路的方向。 希望每個走過路過的朋友,在看完後經過練習,都可以找到自己寫prompt的風格。
Thumbnail
前陣子格友 Vanessa 展示了 美圖秀秀軟體,AI 算圖的功能 (個人不覺得那是畫圖),文章連結如下: 手繪與AI繪畫|美圖秀秀軟體 關於 AI 的思考,Beta 更早之前,已經有完整論述: 我們 與 國道收費員 的距離 就算,Beta 千呼萬喚,提醒大家思考 AI 的衝擊,但無可奈何,公司也
Thumbnail
(2023/4/16) 聽完‎在 Apple Podcasts 上的《財報狗 - 掌握台股美股時事議題》:205.【財經時事放大鏡】NVIDIA GTC 與美國晶片法 Q: 為何語言要大量訓練深度學習不是用擅長複雜運算/電晶體密度也較高的CPU? 其實也不了解GPU/CPU的差異關鍵在哪? A:(f
Thumbnail
以下講一些有關stable diffusion webui的幾個小操作,都不難,也都很實用,也許其實你早就知道了,這些都不是什麼驚奇的事,但我發現似乎並不是所有人都知道這些事。 這些真的都是一些雞毛蒜皮的小事,不足以獨立寫成一篇教學文章,所以我就簡單的匯整一下就好。
Thumbnail
這篇主要是比較目前在stable diffusion webui下的20種採樣方式的圖片生成速度與生成結果比較。此處所說的採樣即是Sampling method,也有的會翻成取樣方法。
Thumbnail
雖然不是完全沒有競爭者,但基本上,在資料中心端的AI 運算處理器中,NVIDIA 可以說是在市場上佔據壟斷性的地位。也就是說,如果未來幾年,科技產業的重點是各家巨頭與新創獨角獸之間的 AI 大戰的話,那 NVIDIA 就是這場戰爭背後,最大的軍火供應商。
Thumbnail
各種不同的構圖方式,以及不同特寫程度的角色畫面,再到畫面中人物呈現的數量差別。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
最近有很多美國的客戶想了解AI運算造成的電力需求大幅提升, 對產業或股價的影響?是否有一些基本的根據來計算, 得出對電力股的股價合理估值在哪裡?
Thumbnail
2022年11月30日,ChatGPT的登場對全球造成了顯著衝擊。隨後,2024年2月15日,OpenAI發布了能夠將文字轉換為圖像的AI模型SORA,這一創新再次引發了巨大的震動。 這兩大創新引發的全球算力需求的增長幅度是前所未有的。 需求的瞬間迅猛增長,但供應的增加卻需要更長的時間。Nv
Thumbnail
本篇分享整理一些我自己常用的,基礎的寫prompt起手勢,記得要根據應用後的測試結果跟個人需求來調整。 希望每個走過路過的朋友,在看完後經過練習,都可以找到自己寫prompt的風格。
Thumbnail
本篇面向AI算圖新手、對寫prompt沒有概念的朋友,以diffusion model系AI繪圖工具為例,分享我自己從零開始學習寫圖像生成prompt的經驗,只談基本架構跟新手上路的方向。 希望每個走過路過的朋友,在看完後經過練習,都可以找到自己寫prompt的風格。
Thumbnail
前陣子格友 Vanessa 展示了 美圖秀秀軟體,AI 算圖的功能 (個人不覺得那是畫圖),文章連結如下: 手繪與AI繪畫|美圖秀秀軟體 關於 AI 的思考,Beta 更早之前,已經有完整論述: 我們 與 國道收費員 的距離 就算,Beta 千呼萬喚,提醒大家思考 AI 的衝擊,但無可奈何,公司也
Thumbnail
(2023/4/16) 聽完‎在 Apple Podcasts 上的《財報狗 - 掌握台股美股時事議題》:205.【財經時事放大鏡】NVIDIA GTC 與美國晶片法 Q: 為何語言要大量訓練深度學習不是用擅長複雜運算/電晶體密度也較高的CPU? 其實也不了解GPU/CPU的差異關鍵在哪? A:(f
Thumbnail
以下講一些有關stable diffusion webui的幾個小操作,都不難,也都很實用,也許其實你早就知道了,這些都不是什麼驚奇的事,但我發現似乎並不是所有人都知道這些事。 這些真的都是一些雞毛蒜皮的小事,不足以獨立寫成一篇教學文章,所以我就簡單的匯整一下就好。
Thumbnail
這篇主要是比較目前在stable diffusion webui下的20種採樣方式的圖片生成速度與生成結果比較。此處所說的採樣即是Sampling method,也有的會翻成取樣方法。
Thumbnail
雖然不是完全沒有競爭者,但基本上,在資料中心端的AI 運算處理器中,NVIDIA 可以說是在市場上佔據壟斷性的地位。也就是說,如果未來幾年,科技產業的重點是各家巨頭與新創獨角獸之間的 AI 大戰的話,那 NVIDIA 就是這場戰爭背後,最大的軍火供應商。
Thumbnail
各種不同的構圖方式,以及不同特寫程度的角色畫面,再到畫面中人物呈現的數量差別。