[深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇

螃蟹_crab

2024/07/26閱讀時間約 9 分鐘

延續上一篇訓練GAM模型，這次我們讓神經網路更多層更複雜一點，來看訓練生成的圖片是否效果會更好。

[深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇

資料集分割處理的部分在延續上篇文章，從第五點開始後修改即可，前面都一樣

訓練過程，比較圖

是不是CNN的效果比MLP還要好，因為CNN比較好捕捉特徵去學習

CNN

CNN

MLP

程式碼

建立建立GAN模型

跟上一篇比起來此模型使用了卷積層和批量正規化，但因為比較多層訓練時間就會比較久。

# 隨機種子設置
tf.random.set_seed(1)
np.random. seed (1)
d = 100
#生成器（Generator）
generator = keras.models.Sequential([
    keras. layers. Dense(7 * 7 * 128, input_shape= [d]), 
    keras. layers. Reshape ( [7, 7, 128]), 
    keras. layers. BatchNormalization (),
    keras. layers. Conv2DTranspose(64, kernel_size=5, strides=2, 
                                    padding="SAME", activation="selu"),
    keras. layers. BatchNormalization (),
    keras. layers. Conv2DTranspose(1, kernel_size=5, strides=2, 
                                   padding="SAME", activation="tanh"),#輸出：-1～1
])
#判別器（Discriminator）
discriminator = keras.models.Sequential([
    keras. layers. Conv2D (64, kernel_size=5, strides=2, 
                           padding="SAME",activation=keras.layers. LeakyReLU(0.2), 
                           input_shape= [28, 28, 1]),
    keras.layers. Dropout (0.4),
    keras. layers. Conv2D(128, kernel_size=5, strides=2, 
                          padding="SAME",activation=keras. layers. LeakyReLU(0.2)),
    keras. layers. Dropout (0.4), 
    keras. layers. Flatten(), 
    keras. layers. Dense(1, activation="sigmoid")
])
# GAN 模型 
# 將生成器和判別器結合在一起，形成一個生成對抗網絡
gan = keras.models.Sequential( [generator, discriminator])

訓練

將訓練資料重新塑形並標準化，並顯示訓練過程

# 因為生成器的輸出使用了 tanh 激活函數，該函數的輸出範圍為 [-1, 1]。
# 重新改變形狀 (60000, 28, 28, 1) 將其值轉換到 [-1, 1] 範圍
x_train_dcgan = x_train.reshape(-1, 28, 28, 1)* 2. - 1.

batch_size = 32
dataset = tf.data.Dataset.from_tensor_slices(x_train_dcgan)
dataset = dataset.shuffle (1000)
# batch(batch_size, drop_remainder=True) 將資料集分批，每批大小為 batch_size，並且丟棄最後不足一批的樣本。
# prefetch(1)：預先準備一批數據，以加快數據加載速度。
dataset = dataset.batch (batch_size, drop_remainder=True) .prefetch (1)
# 調用 train_gan 函數，使用創建的資料集 dataset 訓練 GAN：

train_gan(gan, dataset, batch_size, d, n_epochs=20)

儲存生成模型

generator.save('generator_deep.h5')

模型詳細說明

生成器（Generator）

生成器的目的是從隨機噪聲生成假圖像。

generator = keras.models.Sequential([
    keras.layers.Dense(7 * 7 * 128, input_shape=[d]), 
    keras.layers.Reshape([7, 7, 128]), 
    keras.layers.BatchNormalization(),
    keras.layers.Conv2DTranspose(64, kernel_size=5, strides=2, padding="SAME", activation="selu"),
    keras.layers.BatchNormalization(),
    keras.layers.Conv2DTranspose(1, kernel_size=5, strides=2, padding="SAME", activation="tanh"),  # 輸出：-1～1
])

Dense Layer: 第一層是全連接層，將輸入的隨機向量（形狀為 [d]）轉換為大小為 7 * 7 * 128 的張量。
Reshape Layer: 將張量重塑為 7x7，每個位置有 128 個特徵。
BatchNormalization Layer: 進行批量正規化，以加速訓練和穩定模型。
Conv2DTranspose Layer: 反捲積層，將 7x7x128 的張量升尺度為 14x14x64。這裡使用了 SELU 激活函數。
BatchNormalization Layer: 再次進行批量正規化。
Conv2DTranspose Layer: 最後一個反捲積層，將 14x14x64 的張量升尺度為 28x28x1，並使用 tanh 激活函數。輸出圖像的值範圍為 -1 到 1。

判別器（Discriminator）

判別器的目的是區分真實圖像和生成的假圖像。

discriminator = keras.models.Sequential([
    keras.layers.Conv2D(64, kernel_size=5, strides=2, padding="SAME", activation=keras.layers.LeakyReLU(0.2), input_shape=[28, 28, 1]),
    keras.layers.Dropout(0.4),
    keras.layers.Conv2D(128, kernel_size=5, strides=2, padding="SAME", activation=keras.layers.LeakyReLU(0.2)),
    keras.layers.Dropout(0.4), 
    keras.layers.Flatten(), 
    keras.layers.Dense(1, activation="sigmoid")
])

Conv2D Layer: 第一層是卷積層，輸入形狀為 28x28x1 的圖像。使用 LeakyReLU 激活函數。
Dropout Layer: 用於防止過擬合。
Conv2D Layer: 第二個卷積層，將圖像進一步壓縮，使用 LeakyReLU 激活函數。
Dropout Layer: 再次使用 Dropout 以防止過擬合。
Flatten Layer: 將多維張量展平為一維。
Dense Layer: 最後一層是全連接層，輸出一個標量值，並使用 sigmoid 激活函數以進行二分類。

螃蟹_crab的沙龍AI深度學習筆記生成模型

螃蟹_crab的沙龍

113會員

172Content count

本業是影像辨識軟體開發，閒暇時間進修AI相關內容，將學習到的內容寫成文章分享。

留言0

查看全部

發表第一個留言支持創作者！

螃蟹_crab的沙龍的其他內容

[深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇

本文主要介紹，如何利用GAN生成對抗網路來訓練生成圖片。利用tensorflow，中的keras來建立生成器及鑑別器互相競爭訓練，最後利用訓練好的生成器來生成圖片。 GAN生成對抗網路的介紹它由生成網路(Generator Network)和鑑別網路(Discriminator Netwo

#GAN #生成對抗網路 #生成器

[深度學習]訓練VAE模型用於生成圖片_生成篇

本文將延續上一篇文章，經由訓練好的VAE模型其中的解碼器，來生成圖片。 [深度學習]訓練VAE模型用於生成圖片_訓練篇輸入產生的隨機雜訊，輸入VAE的解碼器後，生成的圖片

#深度學習 #VAE模型 #生成圖片

[深度學習]訓練VAE模型用於生成圖片_訓練篇

本文主要介紹，如何利用VAE變分自編碼器來訓練生成圖片。訓練集資料將採用TF影像資料庫中的fashion_mnist VAE變分自編碼器簡單介紹 •VAE(Variational Auto-Encoder)中文名稱變分自編碼器，主要是一種將原始資料編碼到潛在向量空間，再編碼回來的神經網路。

#深度學習 #VAE模型 #生成圖片

[深度學習]利用Stable Diffusion輸入文字生成圖片

本文下方連結的文章，利用Stable Diffusion生成512 * 512大小的圖片。輸入的文字是 dog flying in space，此模型需輸入英文句子才會準確生成。參考文獻連結該作者在Hugging Face公開的模型去做使用。本文是在Colab上執行。

#StableDiffusion #深度學習 #文字生成圖片

[深度學習]LSTM模型

長短期記憶（英語：Long Short-Term Memory，LSTM）是一種時間循環神經網路（RNN），論文首次發表於1997年。 LSTM（長短期記憶）是一種特定類型的遞歸神經網絡（RNN），在許多需要處理時間序列數據或順序數據的應用中非常有用。以下是一些常見的 LSTM 應用：

#LSTM #深度學習 #長短期記憶

[Python][自然語言]利用NLTK建立自己的情感分析模型

先前上一篇是使用NLT內置的電影評論數據集 movie_reviews，來訓練出情感分析模型，此篇文章介紹可以導入自己的訓練資料集來建立情感分析模組。 [Python][自然語言]NLTK 實現電影評論情感分析所需套件 pip install pandas pip install sci

#NLTK #python #自然語言

Fed 9月會議：傳達「不想要落後給曲線」的正向信號，著手管理市場的衰退預期

重點摘要： 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期，但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱，經濟復甦的時點或是 1Q25 季底附近

#聯準會 #Fed #降息

方格子 vocus 官方沙龍

2024/08/27

「相簿裡最捨不得刪的 N 張照片！」：完成任務抽富士即可拍！

近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎？新版式整體視覺上「更加凸顯圖片」，為了搭配這次的更新，我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務，還有機會獲得富士即可拍，讓你的美好回憶都可以用即可拍珍藏！

#相簿裡最捨不得刪的照片

Learn AI 不 BI

2024/07/13

AI說書 - 從0開始 - 86

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 82 到 AI說書 - 從0開始 - 85 的說明，有一個很重要的結論：最適合您的模型不一定是排行榜上最好的模型，您需要學習 NLP 評

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/07/10

AI說書 - 從0開始 - 82

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 可以透過繼承預訓練模型 (Pretrained Model) 來微調 (Fine-Tune) 以執行下游任務。 Pretrained Mo

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/07/10

AI說書 - 從0開始 - 81

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續xxxx，ChatGPT 產生的程式，我們將它匯入 Colab 執行看看 ( Colab 使用教學見使用Meta釋出的模型，實作Chat GPT - Part 0

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/07/09

AI說書 - 從0開始 - 80

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 xxx ，ChatGPT 除了產生程式周邊的文字描述，事實上它還會回覆程式語法的指令 : !pip install scikit-learn import nu

#AI #ai #PromptEngineering

仁和的論文整理

2024/07/04

AI影像論文(05)：StableDiffusion非對稱性VQGAN

VQGAN是一種基於GAN(生成對抗式網路)的生成式模型，可以創造新的、逼真的圖像或修改已有圖像。本論文介紹了改進VQGAN用於StableDiffusion中的新方法架構，並提出了一種新的非對稱式VQGAN，具有更強的解碼器和兩個設計條件解碼器。論文下方另附相關資料連結。

#論文 #AI #資料科學

Learn AI 不 BI

2024/07/02

AI說書 - 從0開始 - 69

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformers for Natural Language Processing and Computer Vision, 2024 這本書中講 Trainin

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/06/17

AI說書 - 從0開始 - 25

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 24示範了ChatGPT程式的能力，現在我們繼續做下去。 Train a decision tree classifier mod

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/06/16

AI說書 - 從0開始 - 21

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 20中，闡述GPT模型的Supervised and Unsupervised觀點，接著一樣引述書籍：Transformers f

#AI #ai #PromptEngineering

螃蟹_crab的沙龍

2024/01/06

[機器學習]CNN學習MNIST 手寫英文字母資料，用網頁展現成果_Streamlit Web應用程式篇

前言上一篇討論到如何訓練出模型，此篇將說明Streamlit建立的簡單Web應用程式的解說 Streamlit網頁App_貓狗辨識連結程式碼Github連結 [機器學習]CNN學習MNIST 手寫英文字母資料，用網頁展現成果_模型訓練篇如何連動github與stramlit可以參考

#網頁 #Streamlit #python

螃蟹_crab的沙龍

2024/01/06

[機器學習]CNN學習MNIST 手寫英文字母資料，用網頁展現成果_模型訓練篇

streamlit與github連動程式庫，呈現即時預測手寫英文字母整理了一下，先前學的機器學習利用Colab來訓練出能辨識手寫A~Z英文字母的模型，使用的模型是CNN(Convolutional Neural Network，CNN）模型訓練好的模型，當然是要拿來應用，成果呈現

#機器學習 #CNN模型 #手寫辨識

[深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇

訓練過程，比較圖

CNN

MLP

程式碼

建立建立GAN模型

訓練

儲存生成模型

模型詳細說明

生成器（Generator）

判別器（Discriminator）

[深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇

[深度學習]訓練VAE模型用於生成圖片_生成篇

[深度學習]訓練VAE模型用於生成圖片_訓練篇

[深度學習]利用Stable Diffusion輸入文字生成圖片

[深度學習]LSTM模型

[Python][自然語言]利用NLTK建立自己的情感分析模型

[深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇

[深度學習]訓練VAE模型用於生成圖片_生成篇

[深度學習]訓練VAE模型用於生成圖片_訓練篇

[深度學習]利用Stable Diffusion輸入文字生成圖片

[深度學習]LSTM模型

[Python][自然語言]利用NLTK建立自己的情感分析模型

你可能也想看

Fed 9月會議：傳達「不想要落後給曲線」的正向信號，著手管理市場的衰退預期

「相簿裡最捨不得刪的 N 張照片！」：完成任務抽富士即可拍！

AI說書 - 從0開始 - 86

AI說書 - 從0開始 - 82

AI說書 - 從0開始 - 81

AI說書 - 從0開始 - 80

AI影像論文(05)：StableDiffusion非對稱性VQGAN

AI說書 - 從0開始 - 69

AI說書 - 從0開始 - 25

AI說書 - 從0開始 - 21

[機器學習]CNN學習MNIST 手寫英文字母資料，用網頁展現成果_Streamlit Web應用程式篇

[機器學習]CNN學習MNIST 手寫英文字母資料，用網頁展現成果_模型訓練篇

Fed 9月會議：傳達「不想要落後給曲線」的正向信號，著手管理市場的衰退預期

「相簿裡最捨不得刪的 N 張照片！」：完成任務抽富士即可拍！

AI說書 - 從0開始 - 86

AI說書 - 從0開始 - 82

AI說書 - 從0開始 - 81

AI說書 - 從0開始 - 80

AI影像論文(05)：StableDiffusion非對稱性VQGAN

AI說書 - 從0開始 - 69

AI說書 - 從0開始 - 25

AI說書 - 從0開始 - 21

[機器學習]CNN學習MNIST 手寫英文字母資料，用網頁展現成果_Streamlit Web應用程式篇

[機器學習]CNN學習MNIST 手寫英文字母資料，用網頁展現成果_模型訓練篇