更新於 2024/04/23閱讀時間約 2 分鐘

GAN:生成逼真假照片的秘密武器

現AI時代我們常見的生成影像是如何製作出來的,或許你已經開始熟悉AI“假臉”的風格。但由于現在網路上大量流傳的多數是以DALL-E或是Stable Diffiusion+幾個特定的LoRA所生成的結果。以至於人們越來越有識別真假照片的能力。但或許你不知道的是,早在幾年前純粹用GAN生成技術所產出的人像照片就以令人難以分辨了

上面幾張圖中你分得出真假照片嗎? 熟悉AI的你或許可以很輕易的看出其中兩張生成圖。而另外兩張則是來自於“this person doesnot exit”網站,也是生成照片

https://thispersondoesnotexist.com/

GAN簡介

生成對抗網路(GAN)是一種生成模型,由兩個神經網路組成:生成器和鑑別器。生成器的作用是生成假照片,而鑑別器的作用是判斷照片是真是假。

原理

GAN 的工作原理類似於一場零和博弈。生成器和鑑別器相互對抗,不斷提升自己的能力。 * 生成器嘗試生成越來越逼真的假照片,以欺騙鑑別器。 * 鑑別器嘗試提高識別假照片的能力,以不被生成器欺騙。 隨著訓練的進行,生成器生成的假照片會越來越逼真,鑑別器識別假照片的能力也會越來越強。最終,生成器能夠生成與真實照片難以區分的假照片。

邏輯方面的工作原理

GAN 的邏輯方面的工作原理可以用以下步驟概括: 1. 輸入一批真實照片。 2. 生成器生成一批假照片。 3. 鑑別器判斷照片是真是假。 4. 根據鑑別器的判斷,更新生成器和鑑別器的參數。 5. 重複步驟 2 到 4,直到生成器能夠生成與真實照片難以區分的假照片。 GAN 的工作原理可以類比為畫家和鑒賞家之間的對抗。 * 畫家嘗試繪製越來越逼真的畫作,以欺騙鑒賞家。 * 鑒賞家嘗試提高鑒別畫作真偽的能力,以不被畫家欺騙。 隨著時間的推移,畫家的畫作會越來越逼真,鑒賞家的鑒別能力也會越來越強。最終,畫家能夠繪製出與真跡難以區分的畫作。

技術細節

GAN 的技術細節涉及到神經網路的架構和訓練方法。 * 生成器和鑑別器可以採用不同的神經網路架構,例如卷積神經網路(CNN)或遞歸神經網路(RNN)。 * GAN 的訓練方法可以採用不同的損失函數,例如交叉熵損失或 Wasserstein 損失。

應用

GAN 具有廣泛的應用前景,例如: * 圖像生成:GAN 可以用於生成逼真的圖像,例如人臉、風景、物體等。 * 圖像編輯:GAN 可以用於編輯圖像,例如修復舊照片、更換背景等。 * 圖像翻譯:GAN 可以用於將圖像從一種風格轉換為另一種風格,例如將卡通人物轉換為真人照片。

結論

GAN 是一種強大的生成模型,能夠生成與真實照片難以區分的假照片。GAN 具有廣泛的應用前景,在圖像生成、圖像編輯、圖像翻譯等領域具有很大的潛力。

DALL-E與SD的圖片生成都是運用了LLM加上GAN所產生的,然而將LLM運用在此目的是使得GAN的產出較為可控。




分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.