首次用AI應用在接案,好好用?

更新於 發佈於 閱讀時間約 7 分鐘
raw-image

哇,好有視覺衝擊的插圖,是AI算出來的?
上圖是用Midjourney算出來的武打動作,完全沒有經過修改。
第一眼你會感覺到很驚豔,但仔細一看會發現非常多怪東西摻在裏頭。

打給賀,好久不見,最近在忙這個啦!
承羅賓哥之福,近期有幸首次以AI進行案件,由於案件需要保密,就先用過程中一張用不到的圖來說一下。

raw-image

如果要以這張圖來描述一場動作戲,Midjourney算出來的圖可不能興奮地直接拿去交差,因為客戶一看會覺得缺乏誠意。

Midjourney在手指繪製已經有很大的進步,但還是失誤機率還是很高。仔細一看左側西裝男的外套開口在很奇怪的地方,右側西裝男的左手不見了,左大腿的比例也少了一截,且他的嘴不見了。如果是商用這些細節都會被放大檢視,背景貼著奇怪文字的畫,不連貫的紙窗和屋頂多餘的構造,還有背景人物的怪異臉部。

也就是說,Midjourney現在可以幫你完成「主要的構圖」和「光線」,但細節就要靠使用者的經驗去修復了。沒有錯,「構圖」和「光線」依然是AI最強項,在這兩方面可以替用戶省下大量時間。

AI的極大弱點:缺乏方向(鏡位)概念

AI幾乎沒有方向概念,因為它"看"不到,AI只能靠大量的數據拼湊、猜測你的指示詞。

就例如這張動作圖我要的是「女角分腿踢中兩個西裝男」的構圖,即便我輸入了:
The woman split-kicks two men on black suits in the head, the woman kicks two men in black suits on the left and right side with her feet
這種"教它怎麼踢"、"踢人是長怎樣"的鉅細靡遺敘述,它,還是會給你這種駭客任務的動作。

因為AI沒有感官,所以他不知道用什麼踢、怎麼踢,就在大量嘗試中我發現,AI要的是精準的關鍵字和參考圖。直到我給它精確的參考圖...

raw-image

這是跆拳道中的分腿踢,Taekwondo Split Kick。
給AI這張參考圖後,終於得到了更接近的繪製:

raw-image

兩邊的西裝男真的很有型,我喜歡,很有韓漫風格,女角的腿也終於踢出來了,
但是..

你倒是給我踢中啊,你怎麼還躲了呢!
AI就是要這樣跟你唱反調。

也就是說,你必須告訴AI你要哪一種踢,然後給它"讀"得懂的圖跟它說:「照著這樣踢」。然後不斷地抽卡,堪比手遊的抽獎機率(大概幾十張會中一張,一張要數分鐘不等),然後抽中你要的那張。

但是,並不是給了參考圖它就會如你所願,有高機率它會直接吃參考圖的概念,給你生一堆差不多的圖。

raw-image

當我想要女角一次飛踢多人怎麼辦?我給它找跆拳道的圖片。
但是,當AI意會到那是跆拳道時,它就給你一堆穿跆拳道服的圖片。
西裝男全都不穿西裝了,女角不僅換了道服,還踢飛了一隻鞋子,然後完全沒有在打鬥的感覺,就是紮紮實實的跆拳道擺踢。

AI也嚴重缺乏方向概念,你要女角上半身往後仰,仰多少度它不知道,還有鏡位你要怎麼下,也依舊是個未解問題。目前已知的鏡頭指令,就是非常基礎的high angle(俯視)、long shot(遠景)這些,但你希望鏡頭俯視多少角度、斜多少度,還"值得期待"。

AI下的腳色難以連貫,即便使用--cref

雖然這一版Midjourney推出了眾所期待的Character Reference功能,可以讓用戶插入腳色圖片讓AI參考,藉此達成故事連貫性,但目前依舊"進步空間很大"。

YT上有許多影片示範用自己的肖像做出動漫風格大頭照,效果確實相當驚豔。
但正如剛才說的,AI沒有方向感,所以腳色頭部的方向變了,例如正臉換成側臉,腳色的臉型就會跑掉,因為AI會讀取其他資料來"猜測"你要的臉型,導致腳色看起來不連貫。

還有一個非常令人頭痛的問題,就是--cref指令不只讀取了腳色的臉部和服裝,連動作都照吃,而且會固定動作。

raw-image

例如,我想要女角維持上圖這種韓漫美型,我在算圖後面加上--cref,讓它吃該圖的人物造型,再搭配武打動作的參考底圖。

就得到了以下結果:

raw-image

你會發現,腳色造型確實吃到了,肢體、構圖卻也固定住了,我希望是個遠景人物至少膝上的構圖,但因為加了character reference,AI模仿了腳色參考圖膝上的肢體,且雙手只會擺那樣的角度,無論你算再多張都如出一轍。而且,這種固定是吃得死死的,即使我改變了底圖,只要還是有加--cref,動作就會大機率相似。

raw-image

像是這張,我捨棄了niji v6改用Midjourney Alpha v6,肢體有較靈活了些,但還是擺著相似的架拳姿勢,腿完全踢不起來,腳色臉型也跑掉了。而且它還給我加了個簽名...我搜過了,沒有這個人...

那麼,嘗試自己把腳色臉型轉正,再讓AI參考呢?

raw-image

效果還是十分有限,從上圖可以知道腳色風格依舊不一致,且AI對風格關鍵字的反應只能拼湊。

我希望AI能給我90年代日漫帶有美式肌肉感的效果,像是井上雄彥、北条司的城市獵人,我給了1980 retro anime style關鍵字。
於是它給了左邊水汪汪大眼幸運女神風格,中間那位既不像井上雄彥的灌籃高手,又給我穿了短褲要去打籃球了,右邊感覺很好但嘴唇厚了些,給AI吃右邊風格就會產出一堆接近美漫厚唇的人物。

幸運女神

幸運女神

14天AI密集操作心得

以目前經驗來說,單獨使用Midjourney不夠,還要搭配其他工具,像是骨架訓練以及人物模型訓練,和Stable Defusion交互應用可能會好很多。

最重要的是,還要需要有判斷能力的老手,從參考圖、關鍵字開始到AI生圖的揀選、後製修復合成做完整的監修,沒辦法一鍵完成。

14天共2700張左右

14天共2700張左右

一張較為精細的場景概念圖或分鏡圖,原本繪師可能要花三、五天(或更久)才能完成,且還要花很多時間蒐集、消化參考圖,經過14天親自操作,可以大幅縮減至一到兩天。業界設計師、遊戲美術師運用起來就更強了。

raw-image

我們可以反覆改變文字提示權重--iw,或是圖片參考權重--sref來得到不同的生成,還能用Midjourney目前我覺得最強的功能:區域修改Vary Region,終於得到女角同時腳踢兩個西裝男且都有揍到的打擊感。

當然這不是最後成果,女角的左腿依舊太長、背景和臉部都要修改,完成圖需要保密就先放上這張。

也就是說,密集操作14天約生成2,700張圖之後,能知道美術AI目前都還在實驗性階段。而且Midjourney還有個缺點,上圖中可以看到有個Fast Time,是指快速生成時間,每次用fast mode生成圖片都會消耗點數,而標準方案的Fast mode是15小時限制。

我在訂閱Midjourney標準方案第三天就把15小時快速時間用完了,接下來都只能用relax mode普通速度。使用relax mode會有明顯的差異,你不能一次生成多張圖片再挑選、按重複製作時會跳出對話框、生成速度明顯降速(可以到1/4或1/5)。

系統會提示你要不要加購fast mode,而加購是天價。
標準方案是單月30美金,訂閱當天匯率是32.53也就是976台幣,而加購快速時間可以到將近50美金,且加購的快速時間不是持續一整個月,是只有可能30或幾十個小時。

這就有點"手遊遊戲內付費"的概念,你有基本的可以用,還要用你要買,而且這手遊還不是免費,然後你還是要抽卡。

留言
avatar-img
留言分享你的想法!
野口夏-avatar-img
2024/07/23
哩厚!我覺得我真乖,在回家轉乘的公車上跟著你一字一句讀完!
好學-avatar-img
發文者
2024/07/24
野口夏 你健康的很!這就是暈車而已,因為晃動時還要專注用眼就特別人容易暈
avatar-img
是我啦,我好學啦
163會員
167內容數
大量的人性洞察。
2025/01/13
我要愛你愛到死為止。
Thumbnail
2025/01/13
我要愛你愛到死為止。
Thumbnail
2024/09/08
淺度解析台灣影視、遊戲業與美日韓的差異、背後原因。
Thumbnail
2024/09/08
淺度解析台灣影視、遊戲業與美日韓的差異、背後原因。
Thumbnail
2024/08/02
一個不注意,「自動扣款」和「試用一個月」的消費、促銷模式可能就一聲不響挪走你銀行裡的錢,要小心!
Thumbnail
2024/08/02
一個不注意,「自動扣款」和「試用一個月」的消費、促銷模式可能就一聲不響挪走你銀行裡的錢,要小心!
Thumbnail
看更多
你可能也想看
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
AI生成圖片是一個挑戰性的任務,雖然AI能理解文字需求,但仍無法完全想像心中的理想畫面。使用中文描述AI的生成效果約為5成到6成,而加入擬人化的描述可以讓AI更好地理解需求。無論如何,AI生成圖片仍面臨許多挑戰,需要更多的研究與嘗試。
Thumbnail
AI生成圖片是一個挑戰性的任務,雖然AI能理解文字需求,但仍無法完全想像心中的理想畫面。使用中文描述AI的生成效果約為5成到6成,而加入擬人化的描述可以讓AI更好地理解需求。無論如何,AI生成圖片仍面臨許多挑戰,需要更多的研究與嘗試。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News