2024-07-24|閱讀時間 ‧ 約 30 分鐘

AI可以讓你的作品變更好看嗎?答案是「有困難」

raw-image

上圖是我在2014年合成的圖像,全部素材從網路上下載就有。
有接觸電玩或動漫影集的朋友應該已經能知道,主題是《惡魔城 Castlevania》,中央的壯碩金髮男人就是該作第一代吸血獵人 - 西蒙·貝爾蒙多。我的創作動機在致敬這個名場面:

這是1986年科樂美在任天堂家機發行的首代《惡魔城》封面,可以看見精美的手繪風格,現在有了AI,能不能幫我"重製"成手繪或其他風格?

美術工作者使用AI的最大誘因之一,就是「AI能不能讓我的作品更好?」
如果把我多年前的作品交給AI運算,它能不能幫我"重製"成品質更高的作品?
AI能不能幫我強化細節、增強我沒做好的部分,然後保留我想要的特色?

答案是:困難度高。
因為「AI很難在你有詳細設定之下幫你強化」

這是我對這張圖片的描述:
大遠景,一個金髮男人揮舞他的長鞭,他的名叫西蒙·貝爾蒙多,他來自電玩遊戲惡魔城,他身穿皮甲且在他的腰間繫著一把劍,他站在一座像是高塔的城堡,他站在通往城堡的破石橋上,城堡的頂部旁漂浮著兩個像手的巨岩,城堡的後方有一個血色的滿月,城堡的門窗閃爍著血色光芒,城堡被雲層包圍,畫面兩側各有一個石像鬼,石橋上瀰漫霧氣,夜景,16:9比例

英語描述:
extreme long shot, a male vampire hunter named Simon Belmont who's whipping his whip, he has blonde short hair, he is wearing leather armor and a sword tied to his waist, Simon Belmont is from the video game Castlevania, there are gargoyles on both side of the scene, night time, he is in front of a huge tower-like castle, the castle looks like Barad-dûr from the Lord of Rings, there are two hand-like rocks floating by the tip of the tower, the windows of the castle shines bloody lights, a full moon of bloody color behind the castle, the castle is surrended by clouds, the hunter is on a broken stone bridge to the castle, the stone bridge is foggy --ar 16:9

我們先來試試不給任何圖片提示下,AI能不能"畫"得比自己更好:

從上圖可以看出在沒有墊圖的情況下AI會給出相去甚遠的結果,尤其是AI有個最致命的缺點-「漏了一項關鍵描述就要全部從頭」,像是我忘了告訴AI主角要「看著城堡」,AI就會給右上角那種超級看鏡頭又擋住城堡的圖片。這種明顯的錯誤重新算過就好,最棘手的是有些至關重要的細節算了很多張才發現,"阿,背景要加幾個人,主角要穿西裝",這種狀況你就要從頭重算,就算用Vary Region區域修改功能也救不了。

所以你必須在一開始就把所有細節都描述得鉅細靡遺,臉要朝哪邊、手要怎麼擺、哪個東西是哪種顏色,都要描述得一清二楚。但是,餵給Midjourney的描述一旦太長,它就會有某些描述是吃不到的,像是衣服顏色會變、少個物件,你還需要再自己後製修改。

這張從城堡透出來的光線非常不錯,但依舊有大問題,就是整體光源是「青綠色」,青綠在視覺中暗示的是「幽靈與鬼魂」,但吸血鬼不是不幽靈或鬼魂,吸血鬼是魔,血色才是主視覺顏色。

想必AI是吃到魔獸世界WoW的設定。魔獸世界對不死族的主視覺就是大量用了這種青綠色,上圖的妖巫王在Wow中的設定就是一種惡鬼、死靈。

那麼,就來試試墊圖吧:

符合我要的主角位置只有這唯一一張,其餘的AI都改動了位置,除此外主角的姿態也是我要的,但他光著上半身,右手又拿劍而非揮舞長鞭。

這兩張我覺得意外有趣,有2000年代的美術風格,那種3D能力非常青澀卻又想展示技術的野心,像是2000年發售的暗黑破壞神2就是這個風格。

構圖也非常相似,這樣的概念用在封面、桌布就很適合。

接著下一張:

這張的用色就正確了,「魔」的視覺顏色是紅色、黑色、紫色。
但是,我想要的是漂浮在高塔旁的雙手,不是在地上像焦屍的怪東西,雖然有意外的恐怖感,但偏離原設定太多...

你總不能說:欸老闆,這樣好像也不錯欸,我們不要改了直接用吧?
這樣絕對會毀壞美術產品的世界觀,還有美術總監、編劇導演會滿頭問號。

感覺是對了,有高塔形狀的城堡、有血色滿月,有霧,有破石橋,主角也不錯,但每樣都不正確...AI把「煙」和「霧」搞混了,那感覺更像是大火燒出來的煙,或是以前龍兄虎弟或五燈獎舞台上那個濃到不行的乾冰,或是你中秋烤肉收攤時把水倒在木炭噴出來的濃煙,鄰居見狀對你破口大罵的那種...而且血月實在太大顆,按照這個大小,海嘯能有100公尺高...

那我們來看下一張:

這張大概有40%接近了。
雖然還是不正確,但你能在右上角雲層看到一隻巨石手,不是我要的"漂浮在高塔旁"的效果,也有意外奇趣。

另外,你可以看到AI給的城堡總是呈現一個"三角形"結構,我查了一下原來高塔式城堡在一個名作裡出現過-《魔戒》,就是黑暗魔君索倫的要塞巴拉多

Barad-dûr

可惜的是,即使我給AI吃關鍵字Barad-dûr,它依舊給我三角形的要塞,那個宏偉的規模不是城堡而是要塞。
咦,那個三角形要塞怎麼有點眼熟...

沒錯,AI吃到的參考是魔戒的要塞-「米那斯提力斯 Minas Tirith」,下方正是白袍巫師甘道夫。要賽Fortstress在中世紀是軍事堡壘,它會包含多道城牆甚至數個城堡,要塞用來駐紮龐大軍隊和軍械,而城堡多是領主、諸侯的住城,德古拉這樣的吸血鬼是貴族,他用不上大軍,要塞就不符他身分地位了。

接著下一張:

這是我認為氛圍最接近的一張。
雖然城堡並不是我要的高塔,但血色中透出火焰、熔漿的光芒正是我要的,霧的濃度和雲層都分布得恰到好處,月亮的大小剛剛好。可惜就在主人翁的姿態、武器、頭髮都不正確。

也就是說,AI每一項都幫你完成50%,然後你要自己調整它。麻煩就在於,有模糊效果、髮絲、筆刷效果的部分要後製的難度會大幅提高,一旦剪下再合成、重繪,重疊的部分往往會顏色不均。原本你是個繪師,用了AI後你大部分時間都用在合成修補了,那過程是非常枯燥乏味的。

最後,我想再分享一張,我將其中一張「向上擴張」:

Midjourney還有一項功能是:朝四個方向擴張原圖。
我原本想向上擴張出高塔尖頂,卻意外得到後面多出來的城堡和血月。

這像是魔王後面還有魔王的意象,雖然這是不合理的,但意外有一種九層塔「九重天」的概念。漫威雷神索爾的世界觀就是層層相疊的九重天。

我希望AI給我的不是九層塔

漫威雷神的九重天世界觀

這樣的構圖也非常適合用在海報,其實仔細一看1986年的遊戲封面就隱約有這樣的概念,這種構圖法也在之後影視、遊戲中廣泛運用。

長野剛的信長之野望

專為日本遊戲繪製的長野剛大師就愛用這樣的構圖法,將人物往上堆砌卻又不凌亂,這需要很強的空間概念。

在好萊塢商業大片也能看到這種構圖,它能營造非常宏偉的氣勢,且人物大小就會告訴你誰是主角、誰有強大的野心、誰可能是反派,讓消費者還沒購買、進戲院前就先在腦中想像個一輪,無形中增強了進戲院消費的意願。

最後的小結論:每個角度都至關重要

我們能知道不同的構圖會有不同的暗示,我們再看一次2000年暗黑破壞神2的宣傳圖。
這張圖犧牲掉了左半部,但凸顯了右半部強烈的緊張感,更展示暴雪在2000年能做到的建模細節,讓玩家想在遊戲中扮演亞馬遜女戰士與怪物戰鬥。

除了物件的正確度,哪邊要犧牲哪邊要強調,這也是AI還需要克服的難題。

分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.