方格精選

AI算圖一百天的感想 -- 人類畫師完蛋了嗎?

閱讀時間約 13 分鐘
女兒圖鎮樓

前言

一百天前,我第一次接觸到AI算圖,或者俗稱的AI繪圖,一時之間驚為天人,就一頭栽下去研究各種技巧,在大概七十天前,我寫下了 AI算圖,Stable Diffusion的頭一個月 ,又經過了兩個月,有了更多的感想,這篇文章就是這些心得的集合。
在寫自己的心得之前,我想要來討論三個我一直在關注的問題:
  1. AI算圖是繪畫嗎?
    不算。
  2. AI出圖能商用嗎?
    看情況。
  3. 人類畫師完蛋了嗎?
    並沒有。

更多女兒圖

AI算圖是繪畫嗎?

簡單說,不算。
目前主流的AI算圖。都是奠基於Diffusion model,你可以把它想像成一個噴墨式印表機,不斷地印出雜訊圖,但神奇的是,當你將這些雜訊圖用一種特殊的方式疊在一起,你會慢慢看到一個圖形從雜訊中浮出來,直到最後一個清晰無比的圖片就生出來了。如果這種方式也叫繪圖的話,那就太看得起AI了。它就是一個方便的工具,可以從許多輸入之中模擬出一個你想要的圖像。但是一台神奇的印表機,就如同一個超級計算機,我們不會因為一個計算機能秒解出人類出的偏微分方程式,就說這個計算機會數學。
繪畫牽扯的不只是把圖印出來,它還牽扯到材質的選擇,構圖透視與佈局,主題的選擇,物體的主從關係與視覺流動。AI訓練了這些概念,但並沒有主動選擇哪些概念要使用,哪些要揚棄,這是提示詞提供者,也就是AI算圖師的責任。
而身為使用AI算圖師,更不敢自稱是「繪師」或「畫師」,否則若我毫無繪畫技能卻自稱畫師,如果一個人扔隻筆或一片繪圖板在地上,叫我畫個自畫像,那我只能回:
可是臣妾做不到啊!
當然如果你本身就擁有畫技,只是用AI算圖來快速生產素材或做最後的陰影與材質拋光,AI是作為一個輔助工具使用,那就跟照相之後開濾鏡一樣,你還是會照相的,只是想讓圖片更加精彩而已。(事實上,很多影音編輯軟體的濾鏡本身就是AI了)。但是,畫畫與照相的還是人類,照相機與AI就是工具
某些繪圖很明顯不是人類可以做到的
主要使用AI算圖工具產圖的人,不應該自稱是畫家或繪師,因為圖不是我們一筆一筆畫出來的。但現實世界的確有一種職業很適合這種產圖方式,叫做概念設計(Conceptual design)。通常電影場景設計,分鏡稿設計,遊戲角色與場景設計都是使用類似的手法,這種職業注重於將文字等抽象事物具象化成實體的圖片,讓其他人能夠在同一套圖像語言下溝通和製作最終產品。他們不侷限於畫技,圖像只要完成度達到能清楚表現視覺元素即可。對他們來說,用AI做出成品跟手動從素材庫拉素材再手動加工成成品,是一樣的事情。
如果毫無畫技的人使用AI產生美麗的圖像,最適合的職業名稱,也應該叫AI概念設計師。

AI出圖能商用嗎?

分成兩方面來看,一個是AI訓練素材的道德性,一個是AI出圖的著作權歸屬。
AI訓練時使用了數量巨大,且沒有經過作者同意的圖像進行訓練,這樣有道德爭議嗎?就目前來看,日本先開啟了AI軍備競賽的序幕,對一個AI訓練過程而言,就跟學生臨摹大師的畫作一樣,只要不偽冒畫作來獲利,學生臨摹就沒有任何道德問題。
而在AI算圖上,日本將AI比擬為類似一個Photoshop的工具,如果使用者不將AI算出來的圖偽冒成其他畫師的作品牟利,就沒有法律問題。但是眾多繪師攝影師的圖像被AI製作公司拿走訓練,做出可牟利的獨創商品,卻沒有任何報酬,這點也是確實存在的道德爭議,而所有小說、部落格、新聞與各種文字工作者的文字也面臨被LLM無償使用的問題。但在現今所有國家都深怕在AI軍備競賽下落後的情況看來,畫師、攝影師、文字作者的權益將被無情犧牲,而創作者到最後唯一能做的,可能就是參與某種商業供稿平台,讓平台將圖像的訓練權打包出售給AI公司,然後賺取一些微薄的權利金分配。
而在AI出圖面,目前看起來,依照著作權法的定義,一個隨機生成的AI算圖,無異於讓大象自由作畫,或者狒狒拿相機自拍,是沒有著作權的。理論上任何人都能重製後販售牟利。
但這只是理論上。事實上,生圖的提示詞、算圖參數、生圖途中汰弱留強的抉擇、事後用繪圖軟體微修正、套濾鏡,甚至是將好幾個AI生成的圖合併成新圖,在在都牽扯到人類,也就是創作者的決斷與審美觀。在這種情況下,AI出圖就不只是純粹的隨機產物,而是人類意志的展現,這是著作權保障的範圍。
在這種前提下,我相信人類使用AI在某個部分協助了創作的作品都是有著作權的。只要不偽冒他人的作品牟利,是沒有著作權疑慮的。且他人也不能盜用該作者的作品牟利。
偶而,AI產生的圖跟預期不同,但比預期的還要好。

人類畫師完蛋了嗎?

這個問題跟在ChatGPT時代時,「人類程式設計師完蛋了嗎?」是一樣的。
完蛋的不是人類程式設計師,完蛋的一向是不思進取的人類程式設計師。
二十年前的公務員可以用一指神功慢慢敲鍵盤,但現在連最基本的工讀生打字都要飛快才行,原因無他,我們人類一直在學習新東西,拋棄無效率的工具。決定一個職業的存續,一向只決定於供需關係。
在馬車時代,御馬術就是車夫的必備技能,但在汽車時代不會開車就別想應徵計程車駕駛。在電腦時代,文字輸入是白領入門技能,在AI時代,用AI輔助生產就是必備能力。老人永遠懷念過去的美好時代,但技術進步的碾壓是無情的。
在巴基斯坦,一個非營利組織執行了一個計畫,讓伊斯蘭婦女可以租借一隻駱駝,一組攜帶式太陽能充電器與一個數位相機,讓她們可以巡迴附近村落,收費一美元替婦女小孩照相,結果該計畫大受歡迎,一大堆婦女寧願省吃儉用,也要請這些女性攝影師到家裡替她與小孩留下可能是唯一一副的全家福。這些照相的需求,在該計畫推出之前還不存在。
畫師的職業需求會一直存在,因為人類天生愛美,對美感的消費需求是不會衰退的,甚至反過來會因為生產美麗事物的成本持續下降而增加更多對美的需求。
對於畫師的供給也會不斷擴大,因為在前AI時代,繪畫是一個投資巨大,但是進步緩慢的技能,往往練習了四五年,畫出來的東西也搬不上檯面。但是在AI時代,一個只能畫技10分的畫師,可以靠著AI將自己的產出水平提高到60分,儘管其中50分是AI拱上去的,但沒有那關鍵的10分,他也無法靠著AI滿足甲方爸爸各種天馬行空的需求。
且在AI時代,跟程式設計師一樣,需要的技能比重將會從「生產」偏移到「概念」這端。以程式設計師為例,一個有好概念的程式設計師,必須能:
  1. 簡便的流程,讓類似的功能能以盡量簡單固定的步驟製作出來。
  2. 彈性的架構,讓架構能在面對前所未見的新功能需求時,依然有辦法實作出來且不影響舊有的功能。
  3. 易維護性,讓日後接手的工程師靠著入職同一套訓練教材而能看懂並履行維護的工作。
這些屬於「概念」的東西,正是AI不明所以,只能靠人類經驗達到的。AI可以很簡單地替我們為一個功能生產上百種不同的實作程式碼,但必須靠人類來決定哪個程式碼才是最適合這個需求的。
畫師也一樣,相對於「畫技」這種生產面技能,畫師的「審美」就是AI時代決定畫師職涯天花板的概念層技能。畫師必須靠著自身審美的素養,決定AI生產的數千張畫作中,哪些符合自己或甲方的需求,決定什麼步驟可以將不完美的地方補正,更趨近心中審美的理想圖樣,決定什麼樣的畫風、構圖、媒體是符合自己的審美,可以成為自己固定的風格。這是AI沒辦法幫人類決定的。
畫師不會失業,相反地,在未來製造「美」的門檻大幅降低,對於圖畫的需求只會更多更挑惕,而擁有良好審美,能運用手作與AI補強彼此弱點的半人馬型畫師將會是新時代的畫師。在這個時代,以前需要10年才能達到的創作能力,只需要1年繪畫訓練,配合1年AI訓練就能做到,而畫師之間的比拼將會從畫技高低,變成審美觀之間誰的境界更能觸動觀畫者。
技術門檻的降低往往會出現需求大爆發。汽車時代的車輛數量是馬車的好幾百倍,手機的出現讓溝通的需求與供給爆發上千倍,我相信在AI時代依然會遵循此慣例。

心得

最後來提一下這一百天學習AI繪圖的感想。

基礎

Stable Diffusion的Automatic1111擁有非常多設定,以及複雜的增強外掛,如果沒有對主要功能的設定有一定了解,想產出好的圖只能靠盲骰。因此對於全部的基本功能都深入地瞭解了一次,並且寫成一系列的說明文章:
......

ControlNet

在學習各種AI繪圖時,最常遇到的困擾就是無法隨心所欲控制人物的動作與構圖。雖然鍛鍊了LoRA,讓我可以穩定的輸出一樣的人物,但是只靠著提示詞來構築場景,實在是難以施展,更別提高動態的動作場面或者多人構圖。
但在學會了ControlNet之後,深深覺得這就是AI繪圖中,人類能駕馭和指導AI,並且把它當做生產力工具的關鍵。在ControlNet中,人類必須明確指示自己想要的效果,用圖像化的方式指引AI生成我們想要的東西。這種情況下,人類參與的程度大幅增加,AI終於從狂亂隨機的野馬變成了千里駿馬。
運用ControlNet,終於可以控制真人向圖片的姿勢
而製作多人互動的圖片也變成了可能:
在ControlNet之前,公主抱的結果通常是兩坨肉慘不忍睹的肢體交纏

Loopback

另一個堪稱驚喜的是偶然測試出來的功能Loopback,這個功能搭配上ControlNet會出現許多之前我根本想都不敢想的好玩功能,現在我依然在探索Loopback的潛能。
Loopback居然能讓我幫角色更換服裝,根本想不到

漫畫

學習AI算圖,我個人的目的除了探索AI對我們日常生活的衝擊之外,就是探索到底AI繪圖能對毫無美術基礎的我,實現多少原本永遠也不可能達到的夢想,其中一個就是將我腦袋中的故事化成小篇幅漫畫的形式:
到目前為止,看起來是可行的。但同時我也察覺,在AI時代,想要畫漫畫,問題不在於畫技,而是更高層的東西,例如對分鏡的認識、對色彩風格的應用、對於對話與圖像描述的分配、對場景的擺設與對人物動態的想像。限制我的不再是畫技,而是審美,以及檢驗審美的感官能力。
光是分鏡排版就是AI繪圖以外的新知識
光是要將圖片排版成漫畫格式,就讓我學到了AI繪圖以外的一大堆知識。我相信從我個人經驗來說,AI繪圖並不是畫師殺手,而是一個讓繪畫能力有限,但是有東西想要變成視覺媒體的人,有了一個自己來的機會。
且,這讓更多人擁有探索自我的機會,畢竟每天幾百張各式各樣的圖片讓自己挑選什麼要繼續更改,什麼要放棄不做,就是一個對自己審美觀的拷問。久而久之就能知道自己的不足,更想探索更多關於美的知識,提高自己的鑒賞力,同時也能觀賞一些原本自己不懂的藝術語言。這對提高整體「美的需求」是有幫助的。畢竟,所有職業的數量並不取決於供給,而是取決於需求。
希望一年之後,我還能繼續寫出下一份心得報告。看看這365天帶給我什麼進步。

參考

為什麼會看到廣告
18.7K會員
300內容數
寫奇幻小說,畫圖,心得,各式各樣作品的故鄉。
留言0
查看全部
發表第一個留言支持創作者!
小惡鬼慘叫一聲,噴出一道慘綠的血跡,扭曲的身體摔進河水裡。 哈娜吃驚發現自己還活著。 我打贏了?!
芙悠:「畢竟,我們的第一守則是……」 「加入我們,或者受死!」 這,是我與泰洛斯姐妹會的第一次邂逅。我沒有想到這改變了我的一生。
「 芙,芙悠學姊?」哈娜輕聲探問身旁的學姊。 不知是不是書讀得太累,下午的暖陽又太溫柔,芙悠睡得發出如同小貓嗚嗚叫的鼾聲。
在我想像的AI未來之中,這已經是最好的結局。 至少,人類曾經反抗,而且AI認同了這份勇氣。
面對這麼多滿臉橫肉,殺氣騰騰的黑旗幫眾,Hana下意識縮起身子,退了兩步。 Shannon教授伸手一把攬住Hana,一臉鎮定對她說: 「不用怕,老師罩妳!」
慾界,一個惡夢的世界,其中居住了許多吸食精神與夢想維生的神秘生物與惡魔。下面是慾界著名生物的外觀與習性簡介。 如果真的在慾界遇上這些生物,逃,是最好的對策。
小惡鬼慘叫一聲,噴出一道慘綠的血跡,扭曲的身體摔進河水裡。 哈娜吃驚發現自己還活著。 我打贏了?!
芙悠:「畢竟,我們的第一守則是……」 「加入我們,或者受死!」 這,是我與泰洛斯姐妹會的第一次邂逅。我沒有想到這改變了我的一生。
「 芙,芙悠學姊?」哈娜輕聲探問身旁的學姊。 不知是不是書讀得太累,下午的暖陽又太溫柔,芙悠睡得發出如同小貓嗚嗚叫的鼾聲。
在我想像的AI未來之中,這已經是最好的結局。 至少,人類曾經反抗,而且AI認同了這份勇氣。
面對這麼多滿臉橫肉,殺氣騰騰的黑旗幫眾,Hana下意識縮起身子,退了兩步。 Shannon教授伸手一把攬住Hana,一臉鎮定對她說: 「不用怕,老師罩妳!」
慾界,一個惡夢的世界,其中居住了許多吸食精神與夢想維生的神秘生物與惡魔。下面是慾界著名生物的外觀與習性簡介。 如果真的在慾界遇上這些生物,逃,是最好的對策。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
前陣子格友 Vanessa 展示了 美圖秀秀軟體,AI 算圖的功能 (個人不覺得那是畫圖),文章連結如下: 手繪與AI繪畫|美圖秀秀軟體 關於 AI 的思考,Beta 更早之前,已經有完整論述: 我們 與 國道收費員 的距離 就算,Beta 千呼萬喚,提醒大家思考 AI 的衝擊,但無可奈何,公司也
Thumbnail
這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,講解各個各位聽聽AI繪圖的箇中道理。
Thumbnail
人工智慧產出的作品到底有沒有享有著作權? 用來製作產品銷售的話,會不會被追究法律責任? 這些問題是我們運用AI的時候避不可少的議題,其中牽涉的議題也相當廣泛。 今天我們就來聊一聊:人工智慧AI算出來的圖片有版權嗎?
Thumbnail
(2023/4/16) 聽完‎在 Apple Podcasts 上的《財報狗 - 掌握台股美股時事議題》:205.【財經時事放大鏡】NVIDIA GTC 與美國晶片法 Q: 為何語言要大量訓練深度學習不是用擅長複雜運算/電晶體密度也較高的CPU? 其實也不了解GPU/CPU的差異關鍵在哪? A:(f
Thumbnail
雖然不是完全沒有競爭者,但基本上,在資料中心端的AI 運算處理器中,NVIDIA 可以說是在市場上佔據壟斷性的地位。也就是說,如果未來幾年,科技產業的重點是各家巨頭與新創獨角獸之間的 AI 大戰的話,那 NVIDIA 就是這場戰爭背後,最大的軍火供應商。
Thumbnail
作者:陳華夫 AI深度學習的圖像識別、人臉辨識、機器翻譯、及自動駕駛都有比人類優勢創新之處。深度學習無法學得抽象的概念知識,因此無法遷移學習(TL),但人類的學習卻可以學習遷移(ToL),因此人類擁有通用智慧。
Thumbnail
最近AI算圖真的是很有趣,可是網路上的算圖大多提詞是要付費的,這裡也寫個筆記我,有興趣的可以自己架設算圖伺服器。 這裡先把相關需要安裝的軟體網址先記錄下來,還有要玩前最好先有nivdia顯卡。 1.GIT服務器:下載適用自己作業系統的版本 Git - Downloads (git-scm.com)
Thumbnail
AI 創作正夯!究竟AI算圖是工具?還是藝術家?人類藝術家會被取代嗎?
Thumbnail
最近很多人在玩這個,我也跟著開始玩,分別玩了「Disco Diffusion」跟「MidJourney」。 其實要AI算圖需要稍微學一下關鍵字的下法,但我大多就亂玩,尤其「Disco Diffusion」因為圖算很慢,但沒有試用次數問題,我基本上就是每天丟一句話試看,偶而效果不錯,有些則不知所云。
Thumbnail
今天我們來談談什麼叫作「邊緣運算」(Edge computing)? 在傳統情況下,我們常將各式各樣的感應器佈在不同應用中並隨時把所有的資料上傳至雲端伺服器做處理。然而,網路的傳輸需要時間,所以在許多被要求低延遲的應用當中,這樣的架構不一定適合...
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
前陣子格友 Vanessa 展示了 美圖秀秀軟體,AI 算圖的功能 (個人不覺得那是畫圖),文章連結如下: 手繪與AI繪畫|美圖秀秀軟體 關於 AI 的思考,Beta 更早之前,已經有完整論述: 我們 與 國道收費員 的距離 就算,Beta 千呼萬喚,提醒大家思考 AI 的衝擊,但無可奈何,公司也
Thumbnail
這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,講解各個各位聽聽AI繪圖的箇中道理。
Thumbnail
人工智慧產出的作品到底有沒有享有著作權? 用來製作產品銷售的話,會不會被追究法律責任? 這些問題是我們運用AI的時候避不可少的議題,其中牽涉的議題也相當廣泛。 今天我們就來聊一聊:人工智慧AI算出來的圖片有版權嗎?
Thumbnail
(2023/4/16) 聽完‎在 Apple Podcasts 上的《財報狗 - 掌握台股美股時事議題》:205.【財經時事放大鏡】NVIDIA GTC 與美國晶片法 Q: 為何語言要大量訓練深度學習不是用擅長複雜運算/電晶體密度也較高的CPU? 其實也不了解GPU/CPU的差異關鍵在哪? A:(f
Thumbnail
雖然不是完全沒有競爭者,但基本上,在資料中心端的AI 運算處理器中,NVIDIA 可以說是在市場上佔據壟斷性的地位。也就是說,如果未來幾年,科技產業的重點是各家巨頭與新創獨角獸之間的 AI 大戰的話,那 NVIDIA 就是這場戰爭背後,最大的軍火供應商。
Thumbnail
作者:陳華夫 AI深度學習的圖像識別、人臉辨識、機器翻譯、及自動駕駛都有比人類優勢創新之處。深度學習無法學得抽象的概念知識,因此無法遷移學習(TL),但人類的學習卻可以學習遷移(ToL),因此人類擁有通用智慧。
Thumbnail
最近AI算圖真的是很有趣,可是網路上的算圖大多提詞是要付費的,這裡也寫個筆記我,有興趣的可以自己架設算圖伺服器。 這裡先把相關需要安裝的軟體網址先記錄下來,還有要玩前最好先有nivdia顯卡。 1.GIT服務器:下載適用自己作業系統的版本 Git - Downloads (git-scm.com)
Thumbnail
AI 創作正夯!究竟AI算圖是工具?還是藝術家?人類藝術家會被取代嗎?
Thumbnail
最近很多人在玩這個,我也跟著開始玩,分別玩了「Disco Diffusion」跟「MidJourney」。 其實要AI算圖需要稍微學一下關鍵字的下法,但我大多就亂玩,尤其「Disco Diffusion」因為圖算很慢,但沒有試用次數問題,我基本上就是每天丟一句話試看,偶而效果不錯,有些則不知所云。
Thumbnail
今天我們來談談什麼叫作「邊緣運算」(Edge computing)? 在傳統情況下,我們常將各式各樣的感應器佈在不同應用中並隨時把所有的資料上傳至雲端伺服器做處理。然而,網路的傳輸需要時間,所以在許多被要求低延遲的應用當中,這樣的架構不一定適合...