2024-10-08|閱讀時間 ‧ 約 6 分鐘

猜,火車?【2022/10/5】


即使文生圖功能不完美,Stable Diffusion 還有圖生圖功能尚可一戰(?)

所以就算百般不想動筆,生怕繪圖軟體+AI 生成同時開會把筆電弱小顯卡分食殆盡,還是得像求職一樣展現出自己勇於挑戰、樂在創新、積極主動的態度。對我降低創作表現成本的目標根本背道而馳,但面試官會喜歡吧


至於生成什麼畫面?我想到當年暑期檔一部劇情歡樂而且色彩繽紛的電影《子彈列車》,腦海中浮現了一列列車在遠處撞擊產生大爆炸,近處有一節分離車廂脫軌翻覆的景象。

經歷過去一週多的嘗試,我知道當時 AI 很難生成符合空間邏輯的背景,而煙霧、沙塵、火焰這種朦朧的有機型態,倒是怎麼歪都不會讓人看了產生怪異感。那麼做張大爆炸的圖,AI 生成的殘骸再歪,也只會展現這場爆炸的激烈?


此乃藏拙,AI 做不好的事,用人類的腦補去包容它 !


所以我迅速畫好線稿,丟進去圖生圖產生更粗的線稿

生成的線稿

然後開始生成圖片,

問題在於想保留原圖構圖特徵,但構圖得碰運氣,反而黑白色調被保留下來了,

過程彷彿人與電腦無止境互相瞎猜對方的意思,前面猜對的竟然還無法累積?!

用線稿繼續生成的圖像

要知道那是 ControlNet、Lora 還沒出現的年代,AI 生成基本只能靠提示詞去控制,在自己電腦上裝 SD 的使用者人均秤金次,只要 SD 展開便能無限次抽獎,儘管按照規則中大獎的機率很低就是。秤金次有方法能讓自己一定在 30 次抽獎內抽中大獎,而現在我正操作繪圖軟體尋求專屬自己的、抽中大獎的辦法......

我選擇上色。

領域...噢不,SD 展開。

此時改 CFG Scale 終於有意義,可以微調更逼近我的構圖、或是更真實的大場面。

這都飛到天上去啦,我已經看到海的對面不是敵人,是爆炸...

視角降低了點,但全部撞成一團啦

需求的構圖終於出現了,偏偏這張黑煙的樣子一言難盡

然後我針對黑煙不夠自然、以及遠景使用圖生圖局部重繪功能,發現在這張本就不大的512x768 圖片上,所選擇區域實在過於狹小,導致 AI 重繪往往很難填充新內容,遠方城市隨著反覆重繪逐漸被天空掩蓋,像被風化一樣。

最終成品

至此,總共產出了 200 張圖片。


電腦是有極限的,我從 9/27-10/5 短暫的嘗試中學到一件事......

越是玩弄 AI 生成,就越會發現電腦的能力是有極限的......


你到底想說什麼?


......必可活用於下一次(關機)


分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.