首次用AI應用在接案,好好用?

閱讀時間約 7 分鐘
raw-image

哇,好有視覺衝擊的插圖,是AI算出來的?
上圖是用Midjourney算出來的武打動作,完全沒有經過修改。
第一眼你會感覺到很驚豔,但仔細一看會發現非常多怪東西摻在裏頭。

打給賀,好久不見,最近在忙這個啦!
承羅賓哥之福,近期有幸首次以AI進行案件,由於案件需要保密,就先用過程中一張用不到的圖來說一下。

raw-image

如果要以這張圖來描述一場動作戲,Midjourney算出來的圖可不能興奮地直接拿去交差,因為客戶一看會覺得缺乏誠意。

Midjourney在手指繪製已經有很大的進步,但還是失誤機率還是很高。仔細一看左側西裝男的外套開口在很奇怪的地方,右側西裝男的左手不見了,左大腿的比例也少了一截,且他的嘴不見了。如果是商用這些細節都會被放大檢視,背景貼著奇怪文字的畫,不連貫的紙窗和屋頂多餘的構造,還有背景人物的怪異臉部。

也就是說,Midjourney現在可以幫你完成「主要的構圖」和「光線」,但細節就要靠使用者的經驗去修復了。沒有錯,「構圖」和「光線」依然是AI最強項,在這兩方面可以替用戶省下大量時間。

AI的極大弱點:缺乏方向(鏡位)概念

AI幾乎沒有方向概念,因為它"看"不到,AI只能靠大量的數據拼湊、猜測你的指示詞。

就例如這張動作圖我要的是「女角分腿踢中兩個西裝男」的構圖,即便我輸入了:
The woman split-kicks two men on black suits in the head, the woman kicks two men in black suits on the left and right side with her feet
這種"教它怎麼踢"、"踢人是長怎樣"的鉅細靡遺敘述,它,還是會給你這種駭客任務的動作。

因為AI沒有感官,所以他不知道用什麼踢、怎麼踢,就在大量嘗試中我發現,AI要的是精準的關鍵字和參考圖。直到我給它精確的參考圖...

raw-image

這是跆拳道中的分腿踢,Taekwondo Split Kick。
給AI這張參考圖後,終於得到了更接近的繪製:

raw-image

兩邊的西裝男真的很有型,我喜歡,很有韓漫風格,女角的腿也終於踢出來了,
但是..

你倒是給我踢中啊,你怎麼還躲了呢!
AI就是要這樣跟你唱反調。

也就是說,你必須告訴AI你要哪一種踢,然後給它"讀"得懂的圖跟它說:「照著這樣踢」。然後不斷地抽卡,堪比手遊的抽獎機率(大概幾十張會中一張,一張要數分鐘不等),然後抽中你要的那張。

但是,並不是給了參考圖它就會如你所願,有高機率它會直接吃參考圖的概念,給你生一堆差不多的圖。

raw-image

當我想要女角一次飛踢多人怎麼辦?我給它找跆拳道的圖片。
但是,當AI意會到那是跆拳道時,它就給你一堆穿跆拳道服的圖片。
西裝男全都不穿西裝了,女角不僅換了道服,還踢飛了一隻鞋子,然後完全沒有在打鬥的感覺,就是紮紮實實的跆拳道擺踢。

AI也嚴重缺乏方向概念,你要女角上半身往後仰,仰多少度它不知道,還有鏡位你要怎麼下,也依舊是個未解問題。目前已知的鏡頭指令,就是非常基礎的high angle(俯視)、long shot(遠景)這些,但你希望鏡頭俯視多少角度、斜多少度,還"值得期待"。

AI下的腳色難以連貫,即便使用--cref

雖然這一版Midjourney推出了眾所期待的Character Reference功能,可以讓用戶插入腳色圖片讓AI參考,藉此達成故事連貫性,但目前依舊"進步空間很大"。

YT上有許多影片示範用自己的肖像做出動漫風格大頭照,效果確實相當驚豔。
但正如剛才說的,AI沒有方向感,所以腳色頭部的方向變了,例如正臉換成側臉,腳色的臉型就會跑掉,因為AI會讀取其他資料來"猜測"你要的臉型,導致腳色看起來不連貫。

還有一個非常令人頭痛的問題,就是--cref指令不只讀取了腳色的臉部和服裝,連動作都照吃,而且會固定動作。

raw-image

例如,我想要女角維持上圖這種韓漫美型,我在算圖後面加上--cref,讓它吃該圖的人物造型,再搭配武打動作的參考底圖。

就得到了以下結果:

raw-image

你會發現,腳色造型確實吃到了,肢體、構圖卻也固定住了,我希望是個遠景人物至少膝上的構圖,但因為加了character reference,AI模仿了腳色參考圖膝上的肢體,且雙手只會擺那樣的角度,無論你算再多張都如出一轍。而且,這種固定是吃得死死的,即使我改變了底圖,只要還是有加--cref,動作就會大機率相似。

raw-image

像是這張,我捨棄了niji v6改用Midjourney Alpha v6,肢體有較靈活了些,但還是擺著相似的架拳姿勢,腿完全踢不起來,腳色臉型也跑掉了。而且它還給我加了個簽名...我搜過了,沒有這個人...

那麼,嘗試自己把腳色臉型轉正,再讓AI參考呢?

raw-image

效果還是十分有限,從上圖可以知道腳色風格依舊不一致,且AI對風格關鍵字的反應只能拼湊。

我希望AI能給我90年代日漫帶有美式肌肉感的效果,像是井上雄彥、北条司的城市獵人,我給了1980 retro anime style關鍵字。
於是它給了左邊水汪汪大眼幸運女神風格,中間那位既不像井上雄彥的灌籃高手,又給我穿了短褲要去打籃球了,右邊感覺很好但嘴唇厚了些,給AI吃右邊風格就會產出一堆接近美漫厚唇的人物。

幸運女神

幸運女神

14天AI密集操作心得

以目前經驗來說,單獨使用Midjourney不夠,還要搭配其他工具,像是骨架訓練以及人物模型訓練,和Stable Defusion交互應用可能會好很多。

最重要的是,還要需要有判斷能力的老手,從參考圖、關鍵字開始到AI生圖的揀選、後製修復合成做完整的監修,沒辦法一鍵完成。

14天共2700張左右

14天共2700張左右

一張較為精細的場景概念圖或分鏡圖,原本繪師可能要花三、五天(或更久)才能完成,且還要花很多時間蒐集、消化參考圖,經過14天親自操作,可以大幅縮減至一到兩天。業界設計師、遊戲美術師運用起來就更強了。

raw-image

我們可以反覆改變文字提示權重--iw,或是圖片參考權重--sref來得到不同的生成,還能用Midjourney目前我覺得最強的功能:區域修改Vary Region,終於得到女角同時腳踢兩個西裝男且都有揍到的打擊感。

當然這不是最後成果,女角的左腿依舊太長、背景和臉部都要修改,完成圖需要保密就先放上這張。

也就是說,密集操作14天約生成2,700張圖之後,能知道美術AI目前都還在實驗性階段。而且Midjourney還有個缺點,上圖中可以看到有個Fast Time,是指快速生成時間,每次用fast mode生成圖片都會消耗點數,而標準方案的Fast mode是15小時限制。

我在訂閱Midjourney標準方案第三天就把15小時快速時間用完了,接下來都只能用relax mode普通速度。使用relax mode會有明顯的差異,你不能一次生成多張圖片再挑選、按重複製作時會跳出對話框、生成速度明顯降速(可以到1/4或1/5)。

系統會提示你要不要加購fast mode,而加購是天價。
標準方案是單月30美金,訂閱當天匯率是32.53也就是976台幣,而加購快速時間可以到將近50美金,且加購的快速時間不是持續一整個月,是只有可能30或幾十個小時。

這就有點"手遊遊戲內付費"的概念,你有基本的可以用,還要用你要買,而且這手遊還不是免費,然後你還是要抽卡。

151會員
144內容數
大量的人性洞察。
留言0
查看全部
發表第一個留言支持創作者!
是我啦,我好學啦 的其他內容
歐美的肉體恐怖電影為何總比不上東方恐怖電影嚇人?6300字長文,請慎讀。
若是同為創作人的你一定常常問自己: 「該不該開放媒體轉載自己的作品,又該如何判斷?」 媒體邀請轉載可以是一件既令人期待又怕受傷害的事(笑),之前有一家媒體公司的編輯常透過臉書詢問轉載我的文章,有次沒回到對方訊息,那位編輯就沒再來詢問過,怕是我怠慢了她(開玩笑的啦,人家可能升職了)😁。 我的YT
前天我發布了畫了幾天的山道猴子插畫,發布在這幾個平台並觀察用戶反應: 1. 方格子 2. 臉書 3. IG 4. ArtStaion 現在就來公布成效如何,當作一次的觀察! 成績最好-臉書 我發布在臉書上的「iPad電繪/Procreate練功團」,原本我預期按讚數破就該偷笑了,但沒想到截至剛才
正文開始前先小結一下: 這些邪魔歪道兵法是套路招式,還是要有好的基本功支撐,你本身有好內容的話,這些招式會幫你飛速成長,如果"底子"不夠好,效果會有限。 精闢、好笑的留言,吸引人就是一種廣告 自媒體經營有個免費替自己廣告的方法,就是「去別人家裡留言」,只要留言留得好、夠多人按讚喜歡,就能「開傳送
截至今日這支影片在我頻道裡已累積破66萬點閱,另外授權傳媒公司VSmedia也有破70萬點閱,合計至少有130萬點閱。 要做出破數十萬、破百萬點閱影片不是難題,這篇我來分享一些技巧。 首先是器材,你不用花大錢 器材真的不用花大錢,能剪接的電腦4萬左右就能用得嚇嚇叫,現在Iphone畫質很好你甚
歐美的肉體恐怖電影為何總比不上東方恐怖電影嚇人?6300字長文,請慎讀。
若是同為創作人的你一定常常問自己: 「該不該開放媒體轉載自己的作品,又該如何判斷?」 媒體邀請轉載可以是一件既令人期待又怕受傷害的事(笑),之前有一家媒體公司的編輯常透過臉書詢問轉載我的文章,有次沒回到對方訊息,那位編輯就沒再來詢問過,怕是我怠慢了她(開玩笑的啦,人家可能升職了)😁。 我的YT
前天我發布了畫了幾天的山道猴子插畫,發布在這幾個平台並觀察用戶反應: 1. 方格子 2. 臉書 3. IG 4. ArtStaion 現在就來公布成效如何,當作一次的觀察! 成績最好-臉書 我發布在臉書上的「iPad電繪/Procreate練功團」,原本我預期按讚數破就該偷笑了,但沒想到截至剛才
正文開始前先小結一下: 這些邪魔歪道兵法是套路招式,還是要有好的基本功支撐,你本身有好內容的話,這些招式會幫你飛速成長,如果"底子"不夠好,效果會有限。 精闢、好笑的留言,吸引人就是一種廣告 自媒體經營有個免費替自己廣告的方法,就是「去別人家裡留言」,只要留言留得好、夠多人按讚喜歡,就能「開傳送
截至今日這支影片在我頻道裡已累積破66萬點閱,另外授權傳媒公司VSmedia也有破70萬點閱,合計至少有130萬點閱。 要做出破數十萬、破百萬點閱影片不是難題,這篇我來分享一些技巧。 首先是器材,你不用花大錢 器材真的不用花大錢,能剪接的電腦4萬左右就能用得嚇嚇叫,現在Iphone畫質很好你甚
你可能也想看
Thumbnail
「設計不僅僅是外觀和感覺。設計是其運作的方式。」 — Steve Jobs 身為一個獨立文案,許多人會以為我們的生活只需要面對電腦,從無到有,用精巧的文字填滿空白的螢幕,呈現心目中獨具風格的作品。 ——有的時候可以如此,但其實這是我們夢寐以求的偶發日常。 更多的時候,白天的工作時間總被各種繁雜
Thumbnail
台股、美股近期明顯回檔,市場敘事發生改變,壞消息一樁接一樁出現,下一步該怎麼走呢?本文將探討近期的宏觀經濟事件,並分享個人的操作思考。
Thumbnail
文、圖/電通行銷傳播集團 電通行銷傳播集團,自2023年底正式邁入轉型下一階段:AI轉型,旨在推動全方位持續進化成為「全面以客戶為中心,唯一由AI賦能驅動的全方位整合行銷傳播集團」。為了提供AI賦能的整合行銷解決方案,與客戶企業共同推動社會的進步,電通集團串聯起產、官、學界多方合作,打造更
4月29日,協鑫科技控股有限公司發佈2023年度環境、社會及管治報告(ESG)。這是協鑫科技第11份環境、社會及管治報告。與過往不同的是,此份ESG報告首次獲得了SGS鑒證聲明,有效提升報告公信力和透明度。   本次報告披露了大量年度關鍵績效資料,其中環境資料非常亮眼。報告稱,2023
Thumbnail
近期外媒報導指出,蘋果正在積極研發自家的內部電池技術,計畫在2025年商業化,並預計將其應用於2025年後推出的產品,首次亮相可能是在iPhone 17上。 據報導蘋果不僅參與電池材料的開發,還包括陽極和陰極的材料研究,力求創造出與現有電池相比性能更優越的全新電池。蘋果的目標是尋找一種與現有材
Thumbnail
蠟筆小新居然也邁入30週年啦!2023 電影首度推出全3D版本《新次元!蠟筆小新THE MOVIE 超能力大決戰~飛吧!手卷壽司~》,同時也推出日本限定的特別展覽, 以30年來的蠟筆小新電影為主題,展示這些年來電影中的經典場景與角色!一次滿足小新狂粉的最棒展覽>>
Thumbnail
手機科技巨頭蘋果 Apple,在月初正式發布了其 2022 年第四季 (公司內部財務年度則為 2023 第一季) 的財報,然而,本次財報與過往屢創營收新高的狀況不同,出現了過去三年來,蘋果營收年增率首次衰退的紀錄。究竟蘋果在本季,遇到了什麼狀況,是受到短期的影響,還是有長期的問題浮現?
Thumbnail
陽明海運,與萬海、長榮曾經在2020-2021創下輝煌戰績的航海三雄之一,而綜觀陽明歷年股價,在2021年中創下陽明歷史股價新高之後,便一路下殺,而當前則在一個區間陷入盤整期。究竟陽明股票可以買嗎?陽明具體業務是什麼?陽明除息2022配息高達20元,能否以此期待後續行情?
Thumbnail
Facebook母公司 Meta 公佈Q4財報,營收336.7億年增20%略優於預期,但是 EPS年減5%至 $3.67 低於預期的3.84。每日活躍用戶19.3億跟上季比減少了一千萬,低於預期的19.5億,也是首次出現全球DAU衰退。
Thumbnail
我要連發兩篇論文: 論文(Paper)題目是「陪聊型聊天機器人的頭像與回覆數量對使用體驗的影響」及 Demo「打造能自訂頭像與情緒,並提供多則回應的自然語言文字生成陪聊聊天機器人平台 」...
Thumbnail
  文、圖/Yahoo奇摩提供   「Yahoo搜尋人氣大獎2020」頒獎典禮,將於今(27)日起至1月29日,連續三日接力登場,並於Yahoo TV全程播出!受疫情催化,今年活動首次採用延展實境(XR)最新技術,打造虛實整合的頒獎舞台,透過LED顯示器、攝影動作追蹤系統,呈現自然景深和自適應
Thumbnail
疫情持續升溫,台灣餐飲業者受到嚴峻考驗,全台陸續傳出「災情」,從台北到高雄為數不少飯店餐飲業者紛紛重挫或歇業! 如何突破重圍,在經濟指數一路下滑之際讓業績翻轉,考驗著各家業者智慧
Thumbnail
「設計不僅僅是外觀和感覺。設計是其運作的方式。」 — Steve Jobs 身為一個獨立文案,許多人會以為我們的生活只需要面對電腦,從無到有,用精巧的文字填滿空白的螢幕,呈現心目中獨具風格的作品。 ——有的時候可以如此,但其實這是我們夢寐以求的偶發日常。 更多的時候,白天的工作時間總被各種繁雜
Thumbnail
台股、美股近期明顯回檔,市場敘事發生改變,壞消息一樁接一樁出現,下一步該怎麼走呢?本文將探討近期的宏觀經濟事件,並分享個人的操作思考。
Thumbnail
文、圖/電通行銷傳播集團 電通行銷傳播集團,自2023年底正式邁入轉型下一階段:AI轉型,旨在推動全方位持續進化成為「全面以客戶為中心,唯一由AI賦能驅動的全方位整合行銷傳播集團」。為了提供AI賦能的整合行銷解決方案,與客戶企業共同推動社會的進步,電通集團串聯起產、官、學界多方合作,打造更
4月29日,協鑫科技控股有限公司發佈2023年度環境、社會及管治報告(ESG)。這是協鑫科技第11份環境、社會及管治報告。與過往不同的是,此份ESG報告首次獲得了SGS鑒證聲明,有效提升報告公信力和透明度。   本次報告披露了大量年度關鍵績效資料,其中環境資料非常亮眼。報告稱,2023
Thumbnail
近期外媒報導指出,蘋果正在積極研發自家的內部電池技術,計畫在2025年商業化,並預計將其應用於2025年後推出的產品,首次亮相可能是在iPhone 17上。 據報導蘋果不僅參與電池材料的開發,還包括陽極和陰極的材料研究,力求創造出與現有電池相比性能更優越的全新電池。蘋果的目標是尋找一種與現有材
Thumbnail
蠟筆小新居然也邁入30週年啦!2023 電影首度推出全3D版本《新次元!蠟筆小新THE MOVIE 超能力大決戰~飛吧!手卷壽司~》,同時也推出日本限定的特別展覽, 以30年來的蠟筆小新電影為主題,展示這些年來電影中的經典場景與角色!一次滿足小新狂粉的最棒展覽>>
Thumbnail
手機科技巨頭蘋果 Apple,在月初正式發布了其 2022 年第四季 (公司內部財務年度則為 2023 第一季) 的財報,然而,本次財報與過往屢創營收新高的狀況不同,出現了過去三年來,蘋果營收年增率首次衰退的紀錄。究竟蘋果在本季,遇到了什麼狀況,是受到短期的影響,還是有長期的問題浮現?
Thumbnail
陽明海運,與萬海、長榮曾經在2020-2021創下輝煌戰績的航海三雄之一,而綜觀陽明歷年股價,在2021年中創下陽明歷史股價新高之後,便一路下殺,而當前則在一個區間陷入盤整期。究竟陽明股票可以買嗎?陽明具體業務是什麼?陽明除息2022配息高達20元,能否以此期待後續行情?
Thumbnail
Facebook母公司 Meta 公佈Q4財報,營收336.7億年增20%略優於預期,但是 EPS年減5%至 $3.67 低於預期的3.84。每日活躍用戶19.3億跟上季比減少了一千萬,低於預期的19.5億,也是首次出現全球DAU衰退。
Thumbnail
我要連發兩篇論文: 論文(Paper)題目是「陪聊型聊天機器人的頭像與回覆數量對使用體驗的影響」及 Demo「打造能自訂頭像與情緒,並提供多則回應的自然語言文字生成陪聊聊天機器人平台 」...
Thumbnail
  文、圖/Yahoo奇摩提供   「Yahoo搜尋人氣大獎2020」頒獎典禮,將於今(27)日起至1月29日,連續三日接力登場,並於Yahoo TV全程播出!受疫情催化,今年活動首次採用延展實境(XR)最新技術,打造虛實整合的頒獎舞台,透過LED顯示器、攝影動作追蹤系統,呈現自然景深和自適應
Thumbnail
疫情持續升溫,台灣餐飲業者受到嚴峻考驗,全台陸續傳出「災情」,從台北到高雄為數不少飯店餐飲業者紛紛重挫或歇業! 如何突破重圍,在經濟指數一路下滑之際讓業績翻轉,考驗著各家業者智慧