AI 像人類一樣學習嗎 — 淺談AI繪圖生成的原理

2023/05/18 更新2023/05/16 發佈閱讀 4 分鐘

這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的，在接觸這個之前，我也跟大家一樣覺得AI繪圖真的是太神秘了，究竟只會簡簡單單運算數字的電腦，只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理，而是用我理解這件事情的方法，分享給大家看。

談AI怎麼學習畫圖之前，我們先來了解一下AI怎麼”辨認東西"。舉例來說好了，我們今天想要教會AI辨認一隻狗，讓他以後都能認得狗，跟教小Baby學習這件事情一樣，我們就應該先給他看很多狗狗的照片，跟他說這是狗

然後看過數千張不同狗的照片以後，AI終於知道了，對這就是狗! 所以以後我們即使拿他沒有看過的狗的照片給AI看，也因為AI知道了這些特徵的集合就代表了一隻狗，所以可以輸出這是一隻狗的結果。

這就是AI學會辨識物體的方法，但是AI有分很多種Model，這些不同的AI Model各自會不同的絕技，上面說的AI model可以學會辨認很多種物體，可是他沒有辦法做到無中生有，那麼可以學習無中生有的model是什麼呢? 我們這邊介紹一種目前比較主流的generative model 叫做diffusion model. 這個Diffusion model 就是目前各種主要的生成式AI背後的原理 (但是不只diffusion model可以做到就是了)

Diffusion model之所以可以學會怎麼畫圖，當然也是要經過千千萬萬的圖片訓練的，只是他訓練的方式完全不同，假設我們拿底下這張照片來做訓練

除了給這張照片以外，我們還需要給這張照片很清晰的說明，不然還是嬰兒狀態的AI根本不知道這張照片代表的意義是什麼。接下來的訓練步驟非常的有趣，如下圖

首先我們把這張照片加上一點點Noise, 得到了稍微有點雜訊的圖片，然後又可以再加上一點雜訊，持續這樣的過程直到整張圖片都變成雜訊了。接下來我們先取其中的兩張圖片，假設是第一隻原始照片跟第二張好了

然後我們先拿第二張加了一點雜訊的圖片來，加上這句話”A cat laying on the floor” 請AI嘗試產出沒有加上雜訊的圖片。因為現在AI還沒有被訓練也不知道怎麼畫一隻Cat，所以應該產出的圖片會完全不像，如果AI產出很不像的照片，那麼AI目前的作答(權重)就會被處罰(penalty)，如果AI產出的圖片比較接近原來的reference image(我們想要他產出的圖片)，那麼我們就獎勵這個AI的作答。經過千千萬萬次的訓練(猜測)以及獎勵逞罰機制以後，AI就學到了該怎麼把充滿雜訊的圖片還原成原本的圖片，我們上面有一整個系列的照片從完全沒有雜訊到整張圖片都是雜訊，這些都會餵給AI去做訓練。然後當然AI也不會只訓練這一張圖片，而是我們會給它好多好多的照片圖片，搭配我們做好的說明去訓練AI，所以最後千錘百鍊的AI就練成了這樣的功夫….

當我們餵給AI一段文字，加上一整張的雜訊的時候，他就可以把雜訊依照我們給的文字內容，"還原"成一張AI產出來的畫作了，是不是很神奇呢? 而且依照我們給的文字內容跟各種參數調校，產生出比原來的原始照片要漂亮很多的圖片都是非常有可能的。

目前的Diffusion model 依照餵給他訓練的圖片是什麼，就可以產出各式各樣不同的風格，畢竟”AI是看這些圖片長大的" 餵給他很多動漫風格的圖片，將來他產出來的圖片就會充滿動漫風格，如果給他看很多真實的照片，那麼這樣的AI model產出來的就會是非常擬真的圖片，甚至以假亂真。我們將來在其他篇裡面也會介紹到，不同資料訓練出來的AI model ，用同樣的文字可以產生出很多不同的結果。希望以上的介紹，能夠幫助大家多少多了解一些AI怎麼學會畫圖的，我們下次見囉。

技術PM路易斯的沙龍技術PM的AI實驗室AI繪圖技術PM路易斯的沙龍技術PM的AI實驗室AI深度學習

留言

技術PM路易斯的沙龍

51會員

35內容數

技術PM的AI實驗室，是以輕鬆的角度深入簡出的探討各種生成式AI工具的使用。無論你是想理解AI到底是怎麼運作的? 想知道有那些好用的生成式AI工具? 或者是對AI繪圖有興趣的，都歡迎加入我們的AI實驗室一起輕鬆地玩耍，我們邊玩邊學，學習跟AI一起共創新的可能。

技術PM路易斯的沙龍的其他內容

2023/12/23

瞬間生圖的SDXL-Turbo有什麼重要性?

SDXL Turbo主打可以1 step就產生一定品質的圖片 (圖片品質比SDXL甚至SD 1.5還要低)，完全是以速度取勝，那麼SDXL Turbo這個技術代表的是怎樣的突破呢? 究竟秒出圖的技術能夠有什麼實際的應用呢? 這就是我們這篇想要探討的。

2023/12/23

瞬間生圖的SDXL-Turbo有什麼重要性?

2023/11/18

理想的AI載具是什麼?

這篇文章會跟大家介紹，為什麼我覺得ChatGPT的多模態輸入輸出其實是最重要的一個功能之一，讓AI往成為真正人工智慧代理人的路上前進了一大步，我們也會稍微探討(想像)一下，所謂的理想的AI載具到底應該是怎樣的?

2023/11/18

理想的AI載具是什麼?

2023/11/01

[AI翻譯] 好文分享 - 兩種學習 AI提示詞的方法

本篇文章是以ChatGPT翻譯華頓商學院教授Ethan Mollick的文章，並且稍微加上修飾而來的，是一篇相當好的該如何使用AI的引言，分享給各位。我們學到的就是，只要使用AI，你就會學會如何使用AI。你只需大量使用AI，直到你弄清楚它的優點和缺點，就可以成為你領域的AI應用專家。

2023/11/01

[AI翻譯] 好文分享 - 兩種學習 AI提示詞的方法

看更多

你可能也想看

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

長期以來，西方美學以《維特魯威人》式的幾何比例定義「完美身體」，這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯．奧尼奎庫的舞作《轉轉生》，探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

夜晚探索的沙龍

AI生成的貓貓故事

這是一篇介紹如何使用AI來生成貓貓圖片的文章，作者透過幾個軟體的使用經驗，分享了AI生成圖片的效果以及注意事項。文章內容豐富，並且有各種關鍵字和描述，可以吸引潛在讀者。

2024/07/30

2024/07/30

AI算圖咒語概論①｜What the Prompt？

本篇面向AI算圖新手、對寫prompt沒有概念的朋友，以diffusion model系AI繪圖工具為例，分享我自己從零開始學習寫圖像生成prompt的經驗，只談基本架構跟新手上路的方向。希望每個走過路過的朋友，在看完後經過練習，都可以找到自己寫prompt的風格。

#AI繪圖教學#生成式AI#ChatGPT

2023/11/15

你風哥的 AI 分享好讀版

AI算圖咒語概論①｜What the Prompt？

#AI繪圖教學#生成式AI#ChatGPT

2023/11/15

于正龍（Ricky）的沙龍

大型語言模型(LLM)的非常通俗易懂的介紹

[進行中未完成] 1.簡介本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統（如GPT-3、GPT-4、Bing Chat、Bard等）有一些了解。 ChatGPT是一種聊天機器人，是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生，但此文將一一解釋這些概念。

#人工智能#數據#模型

2023/05/18

于正龍（Ricky）的沙龍

大型語言模型(LLM)的非常通俗易懂的介紹

#人工智能#數據#模型

2023/05/18

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇：帕拉贊諾夫的十段殘篇》，如何以十段殘篇，結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭，探討藝術在儀式消失的現代社會如何承接意義，並展現不羈的自由靈魂。

#釀電影#釀評論#藝術評論

2026/02/11

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

#釀電影#釀評論#藝術評論

2026/02/11

Amily的沙龍

在理解與拒絕之間：從多重身分觀看《海妲．蓋柏樂》

若說易卜生的《玩偶之家》為 19 世紀的女性，開啟了一扇離家的窄門，那麼《海妲．蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆，同為熟稔文本的演員，亦是深刻體察制度縫隙的當代女性，此文所看見的不僅僅是崩壞前夕的最後發聲，更是女人被迫置於冷酷的制度之下，步步陷入無以言說的困境。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28