AI 像人類一樣學習嗎 — 淺談AI繪圖生成的原理

閱讀時間約 4 分鐘
The learning AI - by Midjourney
這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,在接觸這個之前,我也跟大家一樣覺得AI繪圖真的是太神秘了,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,分享給大家看。
談AI怎麼學習畫圖之前,我們先來了解一下AI怎麼”辨認東西"。舉例來說好了,我們今天想要教會AI辨認一隻狗,讓他以後都能認得狗,跟教小Baby學習這件事情一樣,我們就應該先給他看很多狗狗的照片,跟他說這是狗
然後看過數千張不同狗的照片以後,AI終於知道了,對這就是狗! 所以以後我們即使拿他沒有看過的狗的照片給AI看,也因為AI知道了這些特徵的集合就代表了一隻狗,所以可以輸出這是一隻狗的結果。
這就是AI學會辨識物體的方法,但是AI有分很多種Model,這些不同的AI Model各自會不同的絕技,上面說的AI model可以學會辨認很多種物體,可是他沒有辦法做到無中生有,那麼可以學習無中生有的model是什麼呢? 我們這邊介紹一種目前比較主流的generative model 叫做diffusion model. 這個Diffusion model 就是目前各種主要的生成式AI背後的原理 (但是不只diffusion model可以做到就是了)
Diffusion model之所以可以學會怎麼畫圖,當然也是要經過千千萬萬的圖片訓練的,只是他訓練的方式完全不同,假設我們拿底下這張照片來做訓練
除了給這張照片以外,我們還需要給這張照片很清晰的說明,不然還是嬰兒狀態的AI根本不知道這張照片代表的意義是什麼。接下來的訓練步驟非常的有趣,如下圖
首先我們把這張照片加上一點點Noise, 得到了稍微有點雜訊的圖片,然後又可以再加上一點雜訊,持續這樣的過程直到整張圖片都變成雜訊了。接下來我們先取其中的兩張圖片,假設是第一隻原始照片跟第二張好了
然後我們先拿第二張加了一點雜訊的圖片來,加上這句話”A cat laying on the floor” 請AI嘗試產出沒有加上雜訊的圖片。因為現在AI還沒有被訓練也不知道怎麼畫一隻Cat,所以應該產出的圖片會完全不像,如果AI產出很不像的照片,那麼AI目前的作答(權重)就會被處罰(penalty),如果AI產出的圖片比較接近原來的reference image(我們想要他產出的圖片),那麼我們就獎勵這個AI的作答。經過千千萬萬次的訓練(猜測)以及獎勵逞罰機制以後,AI就學到了該怎麼把充滿雜訊的圖片還原成原本的圖片,我們上面有一整個系列的照片從完全沒有雜訊到整張圖片都是雜訊,這些都會餵給AI去做訓練。然後當然AI也不會只訓練這一張圖片,而是我們會給它好多好多的照片圖片,搭配我們做好的說明去訓練AI,所以最後千錘百鍊的AI就練成了這樣的功夫….
當我們餵給AI一段文字,加上一整張的雜訊的時候,他就可以把雜訊依照我們給的文字內容,"還原"成一張AI產出來的畫作了,是不是很神奇呢? 而且依照我們給的文字內容跟各種參數調校,產生出比原來的原始照片要漂亮很多的圖片都是非常有可能的。
目前的Diffusion model 依照餵給他訓練的圖片是什麼,就可以產出各式各樣不同的風格,畢竟”AI是看這些圖片長大的" 餵給他很多動漫風格的圖片,將來他產出來的圖片就會充滿動漫風格,如果給他看很多真實的照片,那麼這樣的AI model產出來的就會是非常擬真的圖片,甚至以假亂真。我們將來在其他篇裡面也會介紹到,不同資料訓練出來的AI model ,用同樣的文字可以產生出很多不同的結果。 希望以上的介紹,能夠幫助大家多少多了解一些AI怎麼學會畫圖的,我們下次見囉。
為什麼會看到廣告
技術PM的AI實驗室,是以輕鬆的角度深入簡出的探討各種生成式AI工具的使用。無論你是想理解AI到底是怎麼運作的? 想知道有那些好用的生成式AI工具? 或者是對AI繪圖有興趣的,都歡迎加入我們的AI實驗室一起輕鬆地玩耍,我們邊玩邊學,學習跟AI一起共創新的可能。
留言0
查看全部
發表第一個留言支持創作者!
到底該學習什麼AI的工具呢? 有一次在PODCAST上偶爾然聽到有人分享,該如何有系統的利用3W1H來解決問題,也談到了關於AI工具之類的想法,所以我這邊稍微做了點整理,作為我這邊探討AI工具的開端。
在這個Blog中,我會一步一步地記錄自己如何去學習關於AI的知識,如何應用在生活上/工作上/樂趣上。也希望看到這些文字的你/妳能夠一起有共鳴,一起來分享並且將對未知的恐懼轉化為勇氣。
到底該學習什麼AI的工具呢? 有一次在PODCAST上偶爾然聽到有人分享,該如何有系統的利用3W1H來解決問題,也談到了關於AI工具之類的想法,所以我這邊稍微做了點整理,作為我這邊探討AI工具的開端。
在這個Blog中,我會一步一步地記錄自己如何去學習關於AI的知識,如何應用在生活上/工作上/樂趣上。也希望看到這些文字的你/妳能夠一起有共鳴,一起來分享並且將對未知的恐懼轉化為勇氣。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
我們對AI的認識往往停留在其自動執行任務和模仿人類思維的層面上。但深入探索後,發現AI真正的價值和獨特之處在於其他方面。
Thumbnail
歡迎各位回到Life Architect.這次來到探討有關職場和創業的人類圖.玄商系列.在職場中,生產力往往是員工第一要緊的事.然而,生產力,廣泛而言,並不局限於專業技能,它也可以是企業中層的交際能力,也可以是高層的商業決策明智度. 但是,這些能力和創造價值的時刻,都需要一個人有良好的個人狀態
Thumbnail
2023台灣用戶十大愛用LINE功能出爐!根據LINE團隊觀察自2022年12月至2023年11月,最受台灣用戶青睞的LINE功能就是解放主題富翁時間的「主題自動輪播」,第二名則是運用AI技術自動生成個人照片的「個人檔案工作室」,第三名為台灣暨全球首發的「父親節聊天室特效」。
Thumbnail
本文探討了AI指令與程式碼在語言、運作方式和著作權方面存在差異。AI指令的著作權議題取決於獨立性、原創性、展現形式和目的。AI產生的AI指令可能需要考慮人類參與程度、修改程度以及AI生成的獨立性。AI生成的內容,雖然缺乏創造力和情感,仍是重要的工具和手段,與人類合作能夠發揮最大的潛力。
Thumbnail
小編認為AI利大於弊 小編我對AI目前的評價仍是正面>負面,頂多中立,原因如下: 1. AI是工具,善良的/邪惡的AI,取決於背後控制的人類的道德價值,因為你餵給AI甚麼訓練資料,就成為AI的價值觀。 2. AI是工具,能完全駕馭AI的操作員,必須是邏輯極強的工程師,一般人用AI也只能發揮AI約30
Thumbnail
內向的人在表達上都還蠻吃虧的! 還好,透過GPT-4當你的寫作助手,可以克服人際交流中的害羞和不敢表達自己的問題! 下面是3個你可以用AI突破的人際溝通障礙:
Thumbnail
2023年5月5日在台上映美國電影《追殺代理人》,透過充滿懸疑驚悚的獵捕行動,回溯本片五位主配角之間錯綜複雜的愛恨情仇,當身體素質遠遠強過人類的AI人工智慧機器代理人企圖越位,想跟人類一樣擁有獨立思考能力,追求愛與自由時,人類與超人類AI機器代理人,真能和平相處嗎?
Thumbnail
AI跟人類談戀愛成為某種日常,我們似乎即將迎來這樣的時代。 戀愛能對人類產生一定程度的支配和洗腦作用,說不定AI早已察覺出來了?
Thumbnail
你和GPT相處得如何? 這4個月以來,我一直在思考之後的世界,自己要如何將「人機協作」的技能掌握得更好。 自從啟蒙運動以來,人類一直在不斷地尋求知識和規律,以此創造工具和方法,讓生活更加便捷。然而,隨著AI的出現和發展,我們人類已經不再是世界規律的唯一感知者和發現者。所以,在這個新時代變局下,我們需
Thumbnail
古代最有權力的人就是最會寫作的人,也就是「狀元」,結果現在最有影響力的人也是最會寫作的人,想想真的是蠻有趣的。原來,不管過了幾百年,事物的核心都不會改變......
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
我們對AI的認識往往停留在其自動執行任務和模仿人類思維的層面上。但深入探索後,發現AI真正的價值和獨特之處在於其他方面。
Thumbnail
歡迎各位回到Life Architect.這次來到探討有關職場和創業的人類圖.玄商系列.在職場中,生產力往往是員工第一要緊的事.然而,生產力,廣泛而言,並不局限於專業技能,它也可以是企業中層的交際能力,也可以是高層的商業決策明智度. 但是,這些能力和創造價值的時刻,都需要一個人有良好的個人狀態
Thumbnail
2023台灣用戶十大愛用LINE功能出爐!根據LINE團隊觀察自2022年12月至2023年11月,最受台灣用戶青睞的LINE功能就是解放主題富翁時間的「主題自動輪播」,第二名則是運用AI技術自動生成個人照片的「個人檔案工作室」,第三名為台灣暨全球首發的「父親節聊天室特效」。
Thumbnail
本文探討了AI指令與程式碼在語言、運作方式和著作權方面存在差異。AI指令的著作權議題取決於獨立性、原創性、展現形式和目的。AI產生的AI指令可能需要考慮人類參與程度、修改程度以及AI生成的獨立性。AI生成的內容,雖然缺乏創造力和情感,仍是重要的工具和手段,與人類合作能夠發揮最大的潛力。
Thumbnail
小編認為AI利大於弊 小編我對AI目前的評價仍是正面>負面,頂多中立,原因如下: 1. AI是工具,善良的/邪惡的AI,取決於背後控制的人類的道德價值,因為你餵給AI甚麼訓練資料,就成為AI的價值觀。 2. AI是工具,能完全駕馭AI的操作員,必須是邏輯極強的工程師,一般人用AI也只能發揮AI約30
Thumbnail
內向的人在表達上都還蠻吃虧的! 還好,透過GPT-4當你的寫作助手,可以克服人際交流中的害羞和不敢表達自己的問題! 下面是3個你可以用AI突破的人際溝通障礙:
Thumbnail
2023年5月5日在台上映美國電影《追殺代理人》,透過充滿懸疑驚悚的獵捕行動,回溯本片五位主配角之間錯綜複雜的愛恨情仇,當身體素質遠遠強過人類的AI人工智慧機器代理人企圖越位,想跟人類一樣擁有獨立思考能力,追求愛與自由時,人類與超人類AI機器代理人,真能和平相處嗎?
Thumbnail
AI跟人類談戀愛成為某種日常,我們似乎即將迎來這樣的時代。 戀愛能對人類產生一定程度的支配和洗腦作用,說不定AI早已察覺出來了?
Thumbnail
你和GPT相處得如何? 這4個月以來,我一直在思考之後的世界,自己要如何將「人機協作」的技能掌握得更好。 自從啟蒙運動以來,人類一直在不斷地尋求知識和規律,以此創造工具和方法,讓生活更加便捷。然而,隨著AI的出現和發展,我們人類已經不再是世界規律的唯一感知者和發現者。所以,在這個新時代變局下,我們需
Thumbnail
古代最有權力的人就是最會寫作的人,也就是「狀元」,結果現在最有影響力的人也是最會寫作的人,想想真的是蠻有趣的。原來,不管過了幾百年,事物的核心都不會改變......