AI 像人類一樣學習嗎 — 淺談AI繪圖生成的原理

更新於 發佈於 閱讀時間約 4 分鐘
The learning AI - by Midjourney

The learning AI - by Midjourney

這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,在接觸這個之前,我也跟大家一樣覺得AI繪圖真的是太神秘了,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,分享給大家看。

談AI怎麼學習畫圖之前,我們先來了解一下AI怎麼”辨認東西"。舉例來說好了,我們今天想要教會AI辨認一隻狗,讓他以後都能認得狗,跟教小Baby學習這件事情一樣,我們就應該先給他看很多狗狗的照片,跟他說這是狗

raw-image

然後看過數千張不同狗的照片以後,AI終於知道了,對這就是狗! 所以以後我們即使拿他沒有看過的狗的照片給AI看,也因為AI知道了這些特徵的集合就代表了一隻狗,所以可以輸出這是一隻狗的結果。

raw-image

這就是AI學會辨識物體的方法,但是AI有分很多種Model,這些不同的AI Model各自會不同的絕技,上面說的AI model可以學會辨認很多種物體,可是他沒有辦法做到無中生有,那麼可以學習無中生有的model是什麼呢? 我們這邊介紹一種目前比較主流的generative model 叫做diffusion model. 這個Diffusion model 就是目前各種主要的生成式AI背後的原理 (但是不只diffusion model可以做到就是了)

Diffusion model之所以可以學會怎麼畫圖,當然也是要經過千千萬萬的圖片訓練的,只是他訓練的方式完全不同,假設我們拿底下這張照片來做訓練

raw-image

除了給這張照片以外,我們還需要給這張照片很清晰的說明,不然還是嬰兒狀態的AI根本不知道這張照片代表的意義是什麼。接下來的訓練步驟非常的有趣,如下圖

raw-image

首先我們把這張照片加上一點點Noise, 得到了稍微有點雜訊的圖片,然後又可以再加上一點雜訊,持續這樣的過程直到整張圖片都變成雜訊了。接下來我們先取其中的兩張圖片,假設是第一隻原始照片跟第二張好了

raw-image

然後我們先拿第二張加了一點雜訊的圖片來,加上這句話”A cat laying on the floor” 請AI嘗試產出沒有加上雜訊的圖片。因為現在AI還沒有被訓練也不知道怎麼畫一隻Cat,所以應該產出的圖片會完全不像,如果AI產出很不像的照片,那麼AI目前的作答(權重)就會被處罰(penalty),如果AI產出的圖片比較接近原來的reference image(我們想要他產出的圖片),那麼我們就獎勵這個AI的作答。經過千千萬萬次的訓練(猜測)以及獎勵逞罰機制以後,AI就學到了該怎麼把充滿雜訊的圖片還原成原本的圖片,我們上面有一整個系列的照片從完全沒有雜訊到整張圖片都是雜訊,這些都會餵給AI去做訓練。然後當然AI也不會只訓練這一張圖片,而是我們會給它好多好多的照片圖片,搭配我們做好的說明去訓練AI,所以最後千錘百鍊的AI就練成了這樣的功夫….

raw-image

當我們餵給AI一段文字,加上一整張的雜訊的時候,他就可以把雜訊依照我們給的文字內容,"還原"成一張AI產出來的畫作了,是不是很神奇呢? 而且依照我們給的文字內容跟各種參數調校,產生出比原來的原始照片要漂亮很多的圖片都是非常有可能的。

目前的Diffusion model 依照餵給他訓練的圖片是什麼,就可以產出各式各樣不同的風格,畢竟”AI是看這些圖片長大的" 餵給他很多動漫風格的圖片,將來他產出來的圖片就會充滿動漫風格,如果給他看很多真實的照片,那麼這樣的AI model產出來的就會是非常擬真的圖片,甚至以假亂真。我們將來在其他篇裡面也會介紹到,不同資料訓練出來的AI model ,用同樣的文字可以產生出很多不同的結果。 希望以上的介紹,能夠幫助大家多少多了解一些AI怎麼學會畫圖的,我們下次見囉。



留言
avatar-img
留言分享你的想法!
avatar-img
技術PM路易斯的沙龍
50會員
35內容數
技術PM的AI實驗室,是以輕鬆的角度深入簡出的探討各種生成式AI工具的使用。無論你是想理解AI到底是怎麼運作的? 想知道有那些好用的生成式AI工具? 或者是對AI繪圖有興趣的,都歡迎加入我們的AI實驗室一起輕鬆地玩耍,我們邊玩邊學,學習跟AI一起共創新的可能。
2023/12/23
SDXL Turbo主打可以1 step就產生一定品質的圖片 (圖片品質比SDXL甚至SD 1.5還要低),完全是以速度取勝,那麼SDXL Turbo這個技術代表的是怎樣的突破呢? 究竟秒出圖的技術能夠有什麼實際的應用呢? 這就是我們這篇想要探討的。
Thumbnail
2023/12/23
SDXL Turbo主打可以1 step就產生一定品質的圖片 (圖片品質比SDXL甚至SD 1.5還要低),完全是以速度取勝,那麼SDXL Turbo這個技術代表的是怎樣的突破呢? 究竟秒出圖的技術能夠有什麼實際的應用呢? 這就是我們這篇想要探討的。
Thumbnail
2023/11/18
這篇文章會跟大家介紹,為什麼我覺得ChatGPT的多模態輸入輸出其實是最重要的一個功能之一,讓AI往成為真正人工智慧代理人的路上前進了一大步,我們也會稍微探討(想像)一下,所謂的理想的AI載具到底應該是怎樣的?
Thumbnail
2023/11/18
這篇文章會跟大家介紹,為什麼我覺得ChatGPT的多模態輸入輸出其實是最重要的一個功能之一,讓AI往成為真正人工智慧代理人的路上前進了一大步,我們也會稍微探討(想像)一下,所謂的理想的AI載具到底應該是怎樣的?
Thumbnail
2023/11/01
本篇文章是 以ChatGPT翻譯華頓商學院教授Ethan Mollick的文章,並且稍微加上修飾而來的,是一篇相當好的該如何使用AI的引言,分享給各位。 我們學到的就是,只要使用AI,你就會學會如何使用AI。你只需大量使用AI,直到你弄清楚它的優點和缺點,就可以成為你領域的AI應用專家。
Thumbnail
2023/11/01
本篇文章是 以ChatGPT翻譯華頓商學院教授Ethan Mollick的文章,並且稍微加上修飾而來的,是一篇相當好的該如何使用AI的引言,分享給各位。 我們學到的就是,只要使用AI,你就會學會如何使用AI。你只需大量使用AI,直到你弄清楚它的優點和缺點,就可以成為你領域的AI應用專家。
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
這是一篇介紹如何使用AI來生成貓貓圖片的文章,作者透過幾個軟體的使用經驗,分享了AI生成圖片的效果以及注意事項。文章內容豐富,並且有各種關鍵字和描述,可以吸引潛在讀者。
Thumbnail
這是一篇介紹如何使用AI來生成貓貓圖片的文章,作者透過幾個軟體的使用經驗,分享了AI生成圖片的效果以及注意事項。文章內容豐富,並且有各種關鍵字和描述,可以吸引潛在讀者。
Thumbnail
AI,全稱人工智慧,是指讓電腦或機器具備類似人類的智慧和能力的科學和技術。AI 可以幫助我們解決各種問題,提高效率,創造價值,甚至改變世界。但是,你知道 AI 是如何運作的嗎?你知道 AI 的歷史和未來嗎?你知道 AI 的優點和挑戰嗎?在這篇文章中,我將帶你一起認識 AI 的基本概念和發展。
Thumbnail
AI,全稱人工智慧,是指讓電腦或機器具備類似人類的智慧和能力的科學和技術。AI 可以幫助我們解決各種問題,提高效率,創造價值,甚至改變世界。但是,你知道 AI 是如何運作的嗎?你知道 AI 的歷史和未來嗎?你知道 AI 的優點和挑戰嗎?在這篇文章中,我將帶你一起認識 AI 的基本概念和發展。
Thumbnail
生成式AI(Generative AI)是近年來人工智慧領域中備受矚目的技術之一。它以機器學習為基礎,通過學習大量數據中的模式和關係,能夠生成各種新的內容,涵蓋文字、圖像、音訊等多個領域。本文將深入探討生成式AI的原理、優缺點以及應用範疇。
Thumbnail
生成式AI(Generative AI)是近年來人工智慧領域中備受矚目的技術之一。它以機器學習為基礎,通過學習大量數據中的模式和關係,能夠生成各種新的內容,涵蓋文字、圖像、音訊等多個領域。本文將深入探討生成式AI的原理、優缺點以及應用範疇。
Thumbnail
  當你想到人工智能,也許會想到科幻電影裡那些高智商的機器人。但其實,生成式AI已經在我們的日常生活扮演了一個不那麼引人注目但日益重要的角色。從在社群媒體上看到的那些有趣的圖片,到那首由AI作詞作曲的歌,生成式AI正在以各種有趣的方式改變我們的世界。ChatGPT就是眾所周知的生成式AI之一。
Thumbnail
  當你想到人工智能,也許會想到科幻電影裡那些高智商的機器人。但其實,生成式AI已經在我們的日常生活扮演了一個不那麼引人注目但日益重要的角色。從在社群媒體上看到的那些有趣的圖片,到那首由AI作詞作曲的歌,生成式AI正在以各種有趣的方式改變我們的世界。ChatGPT就是眾所周知的生成式AI之一。
Thumbnail
本篇面向AI算圖新手、對寫prompt沒有概念的朋友,以diffusion model系AI繪圖工具為例,分享我自己從零開始學習寫圖像生成prompt的經驗,只談基本架構跟新手上路的方向。 希望每個走過路過的朋友,在看完後經過練習,都可以找到自己寫prompt的風格。
Thumbnail
本篇面向AI算圖新手、對寫prompt沒有概念的朋友,以diffusion model系AI繪圖工具為例,分享我自己從零開始學習寫圖像生成prompt的經驗,只談基本架構跟新手上路的方向。 希望每個走過路過的朋友,在看完後經過練習,都可以找到自己寫prompt的風格。
Thumbnail
今日我們使用一個也是很簡易的,以ai來抓取生成【圖生圖】,依照你放入的畫風,能夠實現各種風格觸感而不被發現是AI畫的,真是便利的工具,俗稱: AI圖生圖
Thumbnail
今日我們使用一個也是很簡易的,以ai來抓取生成【圖生圖】,依照你放入的畫風,能夠實現各種風格觸感而不被發現是AI畫的,真是便利的工具,俗稱: AI圖生圖
Thumbnail
本篇基於2023/07/30,Leonardo.Ai官方DC中文區的MasterClass大師課實況精華影片的內容來整理,目標對象是使用過AI繪圖工具,但對其底層邏輯沒有概念的朋友。用盡量簡單的方式來講述,深淺結合幫助你在使用上能獲得更高的掌控度。 並逐一介紹在Leo上設置參數與使用功能的技巧。
Thumbnail
本篇基於2023/07/30,Leonardo.Ai官方DC中文區的MasterClass大師課實況精華影片的內容來整理,目標對象是使用過AI繪圖工具,但對其底層邏輯沒有概念的朋友。用盡量簡單的方式來講述,深淺結合幫助你在使用上能獲得更高的掌控度。 並逐一介紹在Leo上設置參數與使用功能的技巧。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News