Raphael AI 科學家

4內容數

現AI時代我們常見的生成影像是如何製作出來的,或許你已經開始熟悉AI“假臉”的風格。但由于現在網路上大量流傳的多數是以DALL-E或是Stable Diffiusion+幾個特定的LoRA所生成的結果。以至於人們越來越有識別真假照片的能力。但或許你不知道的是,早在幾年前純粹用GAN生成技術所產出的人像照片就以令人難以分辨了

上面幾張圖中你分得出真假照片嗎? 熟悉AI的你或許可以很輕易的看出其中兩張生成圖。而另外兩張則是來自於“this person doesnot exit”網站,也是生成照片

https://thispersondoesnotexist.com/

GAN簡介

生成對抗網路(GAN)是一種生成模型,由兩個神經網路組成:生成器和鑑別器。生成器的作用是生成假照片,而鑑別器的作用是判斷照片是真是假。

原理

GAN 的工作原理類似於一場零和博弈。生成器和鑑別器相互對抗,不斷提升自己的能力。 * 生成器嘗試生成越來越逼真的假照片,以欺騙鑑別器。 * 鑑別器嘗試提高識別假照片的能力,以不被生成器欺騙。 隨著訓練的進行,生成器生成的假照片會越來越逼真,鑑別器識別假照片的能力也會越來越強。最終,生成器能夠生成與真實照片難以區分的假照片。

邏輯方面的工作原理

GAN 的邏輯方面的工作原理可以用以下步驟概括: 1. 輸入一批真實照片。 2. 生成器生成一批假照片。 3. 鑑別器判斷照片是真是假。 4. 根據鑑別器的判斷,更新生成器和鑑別器的參數。 5. 重複步驟 2 到 4,直到生成器能夠生成與真實照片難以區分的假照片。 GAN 的工作原理可以類比為畫家和鑒賞家之間的對抗。 * 畫家嘗試繪製越來越逼真的畫作,以欺騙鑒賞家。 * 鑒賞家嘗試提高鑒別畫作真偽的能力,以不被畫家欺騙。 隨著時間的推移,畫家的畫作會越來越逼真,鑒賞家的鑒別能力也會越來越強。最終,畫家能夠繪製出與真跡難以區分的畫作。

技術細節

GAN 的技術細節涉及到神經網路的架構和訓練方法。 * 生成器和鑑別器可以採用不同的神經網路架構,例如卷積神經網路(CNN)或遞歸神經網路(RNN)。 * GAN 的訓練方法可以採用不同的損失函數,例如交叉熵損失或 Wasserstein 損失。

應用

GAN 具有廣泛的應用前景,例如: * 圖像生成:GAN 可以用於生成逼真的圖像,例如人臉、風景、物體等。 * 圖像編輯:GAN 可以用於編輯圖像,例如修復舊照片、更換背景等。 * 圖像翻譯:GAN 可以用於將圖像從一種風格轉換為另一種風格,例如將卡通人物轉換為真人照片。

結論

GAN 是一種強大的生成模型,能夠生成與真實照片難以區分的假照片。GAN 具有廣泛的應用前景,在圖像生成、圖像編輯、圖像翻譯等領域具有很大的潛力。

DALL-E與SD的圖片生成都是運用了LLM加上GAN所產生的,然而將LLM運用在此目的是使得GAN的產出較為可控。




精選內容

圖靈測試是用於衡量機器是否能夠表現出與人類相等的智能的方法。本文介紹了圖靈測試的歷史、原理和評價,並探討了ChatGPT是否能通過該測試的問題
Thumbnail
在這篇文章中,我們將探討如何利用ChatGPT這個強大的語言模型來學習其他語言,並比較其與Google翻譯的優缺點。無論你是想提升外語能力還是在跨文化交流中更加流暢,ChatGPT都是一個極具價值的工具。
Thumbnail
ChatGPT 是 OpenAI 開發的大型語言模型,以其強大的生成能力和對話能力而聞名。 ChatGPT 的訓練過程主要分為兩個階段:預訓練和微調。 微調使用了 RLHF(Reinforcement Learning from Human Feedback)技術,可以有效地提高模型生成內容的質量。
Thumbnail

擁有者

技術分享 - NFT Block-Chain AI GPT LLM Deep-Learning Backend
追蹤最新動態, 和同樣興趣愛好的人一起交流