更新於 2024/01/10閱讀時間約 13 分鐘

AI算圖一百天的感想 -- 人類畫師完蛋了嗎?

女兒圖鎮樓
女兒圖鎮樓

前言

一百天前,我第一次接觸到AI算圖,或者俗稱的AI繪圖,一時之間驚為天人,就一頭栽下去研究各種技巧,在大概七十天前,我寫下了 AI算圖,Stable Diffusion的頭一個月 ,又經過了兩個月,有了更多的感想,這篇文章就是這些心得的集合。
在寫自己的心得之前,我想要來討論三個我一直在關注的問題:
  1. AI算圖是繪畫嗎? 不算。
  2. AI出圖能商用嗎? 看情況。
  3. 人類畫師完蛋了嗎? 並沒有。

更多女兒圖

AI算圖是繪畫嗎?

簡單說,不算。
目前主流的AI算圖。都是奠基於Diffusion model,你可以把它想像成一個噴墨式印表機,不斷地印出雜訊圖,但神奇的是,當你將這些雜訊圖用一種特殊的方式疊在一起,你會慢慢看到一個圖形從雜訊中浮出來,直到最後一個清晰無比的圖片就生出來了。如果這種方式也叫繪圖的話,那就太看得起AI了。它就是一個方便的工具,可以從許多輸入之中模擬出一個你想要的圖像。但是一台神奇的印表機,就如同一個超級計算機,我們不會因為一個計算機能秒解出人類出的偏微分方程式,就說這個計算機會數學。
繪畫牽扯的不只是把圖印出來,它還牽扯到材質的選擇,構圖透視與佈局,主題的選擇,物體的主從關係與視覺流動。AI訓練了這些概念,但並沒有主動選擇哪些概念要使用,哪些要揚棄,這是提示詞提供者,也就是AI算圖師的責任。
而身為使用AI算圖師,更不敢自稱是「繪師」或「畫師」,否則若我毫無繪畫技能卻自稱畫師,如果一個人扔隻筆或一片繪圖板在地上,叫我畫個自畫像,那我只能回:
可是臣妾做不到啊!
當然如果你本身就擁有畫技,只是用AI算圖來快速生產素材或做最後的陰影與材質拋光,AI是作為一個輔助工具使用,那就跟照相之後開濾鏡一樣,你還是會照相的,只是想讓圖片更加精彩而已。(事實上,很多影音編輯軟體的濾鏡本身就是AI了)。但是,畫畫與照相的還是人類,照相機與AI就是工具
某些繪圖很明顯不是人類可以做到的
主要使用AI算圖工具產圖的人,不應該自稱是畫家或繪師,因為圖不是我們一筆一筆畫出來的。但現實世界的確有一種職業很適合這種產圖方式,叫做概念設計(Conceptual design)。通常電影場景設計,分鏡稿設計,遊戲角色與場景設計都是使用類似的手法,這種職業注重於將文字等抽象事物具象化成實體的圖片,讓其他人能夠在同一套圖像語言下溝通和製作最終產品。他們不侷限於畫技,圖像只要完成度達到能清楚表現視覺元素即可。對他們來說,用AI做出成品跟手動從素材庫拉素材再手動加工成成品,是一樣的事情。
如果毫無畫技的人使用AI產生美麗的圖像,最適合的職業名稱,也應該叫AI概念設計師。

AI出圖能商用嗎?

分成兩方面來看,一個是AI訓練素材的道德性,一個是AI出圖的著作權歸屬。
AI訓練時使用了數量巨大,且沒有經過作者同意的圖像進行訓練,這樣有道德爭議嗎?就目前來看,日本先開啟了AI軍備競賽的序幕,對一個AI訓練過程而言,就跟學生臨摹大師的畫作一樣,只要不偽冒畫作來獲利,學生臨摹就沒有任何道德問題。
而在AI算圖上,日本將AI比擬為類似一個Photoshop的工具,如果使用者不將AI算出來的圖偽冒成其他畫師的作品牟利,就沒有法律問題。但是眾多繪師攝影師的圖像被AI製作公司拿走訓練,做出可牟利的獨創商品,卻沒有任何報酬,這點也是確實存在的道德爭議,而所有小說、部落格、新聞與各種文字工作者的文字也面臨被LLM無償使用的問題。但在現今所有國家都深怕在AI軍備競賽下落後的情況看來,畫師、攝影師、文字作者的權益將被無情犧牲,而創作者到最後唯一能做的,可能就是參與某種商業供稿平台,讓平台將圖像的訓練權打包出售給AI公司,然後賺取一些微薄的權利金分配。
而在AI出圖面,目前看起來,依照著作權法的定義,一個隨機生成的AI算圖,無異於讓大象自由作畫,或者狒狒拿相機自拍,是沒有著作權的。理論上任何人都能重製後販售牟利。
但這只是理論上。事實上,生圖的提示詞、算圖參數、生圖途中汰弱留強的抉擇、事後用繪圖軟體微修正、套濾鏡,甚至是將好幾個AI生成的圖合併成新圖,在在都牽扯到人類,也就是創作者的決斷與審美觀。在這種情況下,AI出圖就不只是純粹的隨機產物,而是人類意志的展現,這是著作權保障的範圍。
在這種前提下,我相信人類使用AI在某個部分協助了創作的作品都是有著作權的。只要不偽冒他人的作品牟利,是沒有著作權疑慮的。且他人也不能盜用該作者的作品牟利。
偶而,AI產生的圖跟預期不同,但比預期的還要好。

人類畫師完蛋了嗎?

這個問題跟在ChatGPT時代時,「人類程式設計師完蛋了嗎?」是一樣的。
完蛋的不是人類程式設計師,完蛋的一向是不思進取的人類程式設計師。
二十年前的公務員可以用一指神功慢慢敲鍵盤,但現在連最基本的工讀生打字都要飛快才行,原因無他,我們人類一直在學習新東西,拋棄無效率的工具。決定一個職業的存續,一向只決定於供需關係。
在馬車時代,御馬術就是車夫的必備技能,但在汽車時代不會開車就別想應徵計程車駕駛。在電腦時代,文字輸入是白領入門技能,在AI時代,用AI輔助生產就是必備能力。老人永遠懷念過去的美好時代,但技術進步的碾壓是無情的。
在巴基斯坦,一個非營利組織執行了一個計畫,讓伊斯蘭婦女可以租借一隻駱駝,一組攜帶式太陽能充電器與一個數位相機,讓她們可以巡迴附近村落,收費一美元替婦女小孩照相,結果該計畫大受歡迎,一大堆婦女寧願省吃儉用,也要請這些女性攝影師到家裡替她與小孩留下可能是唯一一副的全家福。這些照相的需求,在該計畫推出之前還不存在。
畫師的職業需求會一直存在,因為人類天生愛美,對美感的消費需求是不會衰退的,甚至反過來會因為生產美麗事物的成本持續下降而增加更多對美的需求。
對於畫師的供給也會不斷擴大,因為在前AI時代,繪畫是一個投資巨大,但是進步緩慢的技能,往往練習了四五年,畫出來的東西也搬不上檯面。但是在AI時代,一個只能畫技10分的畫師,可以靠著AI將自己的產出水平提高到60分,儘管其中50分是AI拱上去的,但沒有那關鍵的10分,他也無法靠著AI滿足甲方爸爸各種天馬行空的需求。
且在AI時代,跟程式設計師一樣,需要的技能比重將會從「生產」偏移到「概念」這端。以程式設計師為例,一個有好概念的程式設計師,必須能:
  1. 簡便的流程,讓類似的功能能以盡量簡單固定的步驟製作出來。
  2. 彈性的架構,讓架構能在面對前所未見的新功能需求時,依然有辦法實作出來且不影響舊有的功能。
  3. 易維護性,讓日後接手的工程師靠著入職同一套訓練教材而能看懂並履行維護的工作。
這些屬於「概念」的東西,正是AI不明所以,只能靠人類經驗達到的。AI可以很簡單地替我們為一個功能生產上百種不同的實作程式碼,但必須靠人類來決定哪個程式碼才是最適合這個需求的。
畫師也一樣,相對於「畫技」這種生產面技能,畫師的「審美」就是AI時代決定畫師職涯天花板的概念層技能。畫師必須靠著自身審美的素養,決定AI生產的數千張畫作中,哪些符合自己或甲方的需求,決定什麼步驟可以將不完美的地方補正,更趨近心中審美的理想圖樣,決定什麼樣的畫風、構圖、媒體是符合自己的審美,可以成為自己固定的風格。這是AI沒辦法幫人類決定的。
畫師不會失業,相反地,在未來製造「美」的門檻大幅降低,對於圖畫的需求只會更多更挑惕,而擁有良好審美,能運用手作與AI補強彼此弱點的半人馬型畫師將會是新時代的畫師。在這個時代,以前需要10年才能達到的創作能力,只需要1年繪畫訓練,配合1年AI訓練就能做到,而畫師之間的比拼將會從畫技高低,變成審美觀之間誰的境界更能觸動觀畫者。
技術門檻的降低往往會出現需求大爆發。汽車時代的車輛數量是馬車的好幾百倍,手機的出現讓溝通的需求與供給爆發上千倍,我相信在AI時代依然會遵循此慣例。

心得

最後來提一下這一百天學習AI繪圖的感想。

基礎
Stable Diffusion的Automatic1111擁有非常多設定,以及複雜的增強外掛,如果沒有對主要功能的設定有一定了解,想產出好的圖只能靠盲骰。因此對於全部的基本功能都深入地瞭解了一次,並且寫成一系列的說明文章:
Stable Diffusion基礎 -- 文生圖(txt2img)
Stable Diffusion基礎 -- 高解析度修復(Hires. fix)
Stable Diffusion基礎 -- 圖生圖(img2img)
......

ControlNet
在學習各種AI繪圖時,最常遇到的困擾就是無法隨心所欲控制人物的動作與構圖。雖然鍛鍊了LoRA,讓我可以穩定的輸出一樣的人物,但是只靠著提示詞來構築場景,實在是難以施展,更別提高動態的動作場面或者多人構圖。
但在學會了ControlNet之後,深深覺得這就是AI繪圖中,人類能駕馭和指導AI,並且把它當做生產力工具的關鍵。在ControlNet中,人類必須明確指示自己想要的效果,用圖像化的方式指引AI生成我們想要的東西。這種情況下,人類參與的程度大幅增加,AI終於從狂亂隨機的野馬變成了千里駿馬。
運用ControlNet,終於可以控制真人向圖片的姿勢
而製作多人互動的圖片也變成了可能:
在ControlNet之前,公主抱的結果通常是兩坨肉慘不忍睹的肢體交纏

Loopback
另一個堪稱驚喜的是偶然測試出來的功能Loopback,這個功能搭配上ControlNet會出現許多之前我根本想都不敢想的好玩功能,現在我依然在探索Loopback的潛能。
Loopback居然能讓我幫角色更換服裝,根本想不到

漫畫
學習AI算圖,我個人的目的除了探索AI對我們日常生活的衝擊之外,就是探索到底AI繪圖能對毫無美術基礎的我,實現多少原本永遠也不可能達到的夢想,其中一個就是將我腦袋中的故事化成小篇幅漫畫的形式:
(漫畫)姊妹會秘儀 -- Stable Diffusion繪製
到目前為止,看起來是可行的。但同時我也察覺,在AI時代,想要畫漫畫,問題不在於畫技,而是更高層的東西,例如對分鏡的認識、對色彩風格的應用、對於對話與圖像描述的分配、對場景的擺設與對人物動態的想像。限制我的不再是畫技,而是審美,以及檢驗審美的感官能力。
光是分鏡排版就是AI繪圖以外的新知識
光是要將圖片排版成漫畫格式,就讓我學到了AI繪圖以外的一大堆知識。我相信從我個人經驗來說,AI繪圖並不是畫師殺手,而是一個讓繪畫能力有限,但是有東西想要變成視覺媒體的人,有了一個自己來的機會。
且,這讓更多人擁有探索自我的機會,畢竟每天幾百張各式各樣的圖片讓自己挑選什麼要繼續更改,什麼要放棄不做,就是一個對自己審美觀的拷問。久而久之就能知道自己的不足,更想探索更多關於美的知識,提高自己的鑒賞力,同時也能觀賞一些原本自己不懂的藝術語言。這對提高整體「美的需求」是有幫助的。畢竟,所有職業的數量並不取決於供給,而是取決於需求。
希望一年之後,我還能繼續寫出下一份心得報告。看看這365天帶給我什麼進步。

參考

「AI 算圖」,帶來的衝擊
人工智慧能取代程序員嗎? 前提與實務面的論證告訴你:「永遠不會」
AIGC 對攝影行業的影響!適應新工具的方法是回歸初心?! ft. 專業攝影師Andy
AI 浪尖上的遊戲產業 feat. 遊戲總監 尹口
分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.