[深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇

螃蟹_crab

發佈於AI深度學習筆記

更新於 2024/07/26發佈於 2024/07/26閱讀時間約 9 分鐘

延續上一篇訓練GAM模型，這次我們讓神經網路更多層更複雜一點，來看訓練生成的圖片是否效果會更好。

[深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇

資料集分割處理的部分在延續上篇文章，從第五點開始後修改即可，前面都一樣

訓練過程，比較圖

是不是CNN的效果比MLP還要好，因為CNN比較好捕捉特徵去學習

CNN

CNN

MLP

程式碼

建立建立GAN模型

跟上一篇比起來此模型使用了卷積層和批量正規化，但因為比較多層訓練時間就會比較久。

# 隨機種子設置
tf.random.set_seed(1)
np.random. seed (1)
d = 100
#生成器（Generator）
generator = keras.models.Sequential([
    keras. layers. Dense(7 * 7 * 128, input_shape= [d]), 
    keras. layers. Reshape ( [7, 7, 128]), 
    keras. layers. BatchNormalization (),
    keras. layers. Conv2DTranspose(64, kernel_size=5, strides=2, 
                                    padding="SAME", activation="selu"),
    keras. layers. BatchNormalization (),
    keras. layers. Conv2DTranspose(1, kernel_size=5, strides=2, 
                                   padding="SAME", activation="tanh"),#輸出：-1～1
])
#判別器（Discriminator）
discriminator = keras.models.Sequential([
    keras. layers. Conv2D (64, kernel_size=5, strides=2, 
                           padding="SAME",activation=keras.layers. LeakyReLU(0.2), 
                           input_shape= [28, 28, 1]),
    keras.layers. Dropout (0.4),
    keras. layers. Conv2D(128, kernel_size=5, strides=2, 
                          padding="SAME",activation=keras. layers. LeakyReLU(0.2)),
    keras. layers. Dropout (0.4), 
    keras. layers. Flatten(), 
    keras. layers. Dense(1, activation="sigmoid")
])
# GAN 模型 
# 將生成器和判別器結合在一起，形成一個生成對抗網絡
gan = keras.models.Sequential( [generator, discriminator])

訓練

將訓練資料重新塑形並標準化，並顯示訓練過程

# 因為生成器的輸出使用了 tanh 激活函數，該函數的輸出範圍為 [-1, 1]。
# 重新改變形狀 (60000, 28, 28, 1) 將其值轉換到 [-1, 1] 範圍
x_train_dcgan = x_train.reshape(-1, 28, 28, 1)* 2. - 1.

batch_size = 32
dataset = tf.data.Dataset.from_tensor_slices(x_train_dcgan)
dataset = dataset.shuffle (1000)
# batch(batch_size, drop_remainder=True) 將資料集分批，每批大小為 batch_size，並且丟棄最後不足一批的樣本。
# prefetch(1)：預先準備一批數據，以加快數據加載速度。
dataset = dataset.batch (batch_size, drop_remainder=True) .prefetch (1)
# 調用 train_gan 函數，使用創建的資料集 dataset 訓練 GAN：

train_gan(gan, dataset, batch_size, d, n_epochs=20)

儲存生成模型

generator.save('generator_deep.h5')

模型詳細說明

生成器（Generator）

生成器的目的是從隨機噪聲生成假圖像。

generator = keras.models.Sequential([
    keras.layers.Dense(7 * 7 * 128, input_shape=[d]), 
    keras.layers.Reshape([7, 7, 128]), 
    keras.layers.BatchNormalization(),
    keras.layers.Conv2DTranspose(64, kernel_size=5, strides=2, padding="SAME", activation="selu"),
    keras.layers.BatchNormalization(),
    keras.layers.Conv2DTranspose(1, kernel_size=5, strides=2, padding="SAME", activation="tanh"),  # 輸出：-1～1
])

Dense Layer: 第一層是全連接層，將輸入的隨機向量（形狀為 [d]）轉換為大小為 7 * 7 * 128 的張量。
Reshape Layer: 將張量重塑為 7x7，每個位置有 128 個特徵。
BatchNormalization Layer: 進行批量正規化，以加速訓練和穩定模型。
Conv2DTranspose Layer: 反捲積層，將 7x7x128 的張量升尺度為 14x14x64。這裡使用了 SELU 激活函數。
BatchNormalization Layer: 再次進行批量正規化。
Conv2DTranspose Layer: 最後一個反捲積層，將 14x14x64 的張量升尺度為 28x28x1，並使用 tanh 激活函數。輸出圖像的值範圍為 -1 到 1。

判別器（Discriminator）

判別器的目的是區分真實圖像和生成的假圖像。

discriminator = keras.models.Sequential([
    keras.layers.Conv2D(64, kernel_size=5, strides=2, padding="SAME", activation=keras.layers.LeakyReLU(0.2), input_shape=[28, 28, 1]),
    keras.layers.Dropout(0.4),
    keras.layers.Conv2D(128, kernel_size=5, strides=2, padding="SAME", activation=keras.layers.LeakyReLU(0.2)),
    keras.layers.Dropout(0.4), 
    keras.layers.Flatten(), 
    keras.layers.Dense(1, activation="sigmoid")
])

Conv2D Layer: 第一層是卷積層，輸入形狀為 28x28x1 的圖像。使用 LeakyReLU 激活函數。
Dropout Layer: 用於防止過擬合。
Conv2D Layer: 第二個卷積層，將圖像進一步壓縮，使用 LeakyReLU 激活函數。
Dropout Layer: 再次使用 Dropout 以防止過擬合。
Flatten Layer: 將多維張量展平為一維。
Dense Layer: 最後一層是全連接層，輸出一個標量值，並使用 sigmoid 激活函數以進行二分類。

螃蟹_crab的沙龍AI深度學習筆記生成模型

螃蟹_crab的沙龍

134會員

222內容數

本業是影像辨識軟體開發，閒暇時間進修AI相關內容，將學習到的內容寫成文章分享。

留言1

留言分享你的想法！

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

螃蟹_crab的沙龍的其他內容

[深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇

本文主要介紹，如何利用GAN生成對抗網路來訓練生成圖片。利用tensorflow，中的keras來建立生成器及鑑別器互相競爭訓練，最後利用訓練好的生成器來生成圖片。 GAN生成對抗網路的介紹它由生成網路(Generator Network)和鑑別網路(Discriminator Netwo

#GAN #生成對抗網路 #生成器

[深度學習]訓練VAE模型用於生成圖片_生成篇

本文將延續上一篇文章，經由訓練好的VAE模型其中的解碼器，來生成圖片。 [深度學習]訓練VAE模型用於生成圖片_訓練篇輸入產生的隨機雜訊，輸入VAE的解碼器後，生成的圖片

#深度學習 #VAE模型 #生成圖片

[深度學習]訓練VAE模型用於生成圖片_訓練篇

本文主要介紹，如何利用VAE變分自編碼器來訓練生成圖片。訓練集資料將採用TF影像資料庫中的fashion_mnist VAE變分自編碼器簡單介紹 •VAE(Variational Auto-Encoder)中文名稱變分自編碼器，主要是一種將原始資料編碼到潛在向量空間，再編碼回來的神經網路。

#深度學習 #VAE模型 #生成圖片

[深度學習]利用Stable Diffusion輸入文字生成圖片

本文下方連結的文章，利用Stable Diffusion生成512 * 512大小的圖片。輸入的文字是 dog flying in space，此模型需輸入英文句子才會準確生成。參考文獻連結該作者在Hugging Face公開的模型去做使用。本文是在Colab上執行。

#StableDiffusion #深度學習 #文字生成圖片

[深度學習]LSTM模型

長短期記憶（英語：Long Short-Term Memory，LSTM）是一種時間循環神經網路（RNN），論文首次發表於1997年。 LSTM（長短期記憶）是一種特定類型的遞歸神經網絡（RNN），在許多需要處理時間序列數據或順序數據的應用中非常有用。以下是一些常見的 LSTM 應用：

#LSTM #深度學習 #長短期記憶

[Python][自然語言]利用NLTK建立自己的情感分析模型

先前上一篇是使用NLT內置的電影評論數據集 movie_reviews，來訓練出情感分析模型，此篇文章介紹可以導入自己的訓練資料集來建立情感分析模組。 [Python][自然語言]NLTK 實現電影評論情感分析所需套件 pip install pandas pip install sci

#NLTK #python #自然語言

[深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇

#GAN #生成對抗網路 #生成器

[深度學習]訓練VAE模型用於生成圖片_生成篇

#深度學習 #VAE模型 #生成圖片

[深度學習]訓練VAE模型用於生成圖片_訓練篇

#深度學習 #VAE模型 #生成圖片

[深度學習]利用Stable Diffusion輸入文字生成圖片

#StableDiffusion #深度學習 #文字生成圖片

[深度學習]LSTM模型

#LSTM #深度學習 #長短期記憶

[Python][自然語言]利用NLTK建立自己的情感分析模型

你可能也想看

國泰世華CUBE App 美的生活體驗，給予你最好的情緒。

現代社會跟以前不同了，人人都有一支手機，只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行，然而如今科技快速發展之下，金融App無聲無息地進到你生活中。但同樣的，每一家銀行都有自己的App時，我們又該如何選擇呢？(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB

#國泰世華 #CUBE卡 #金融

柴郡貓姍蒂的沙龍

2024/08/11

筆記-深度學習模型訓練：在Colab上安裝DGL

前言最近在研究GAT，在網路上看到使用torch和DGL實作的GAT模型的程式碼，就想說下載下來自己跑跑看，這篇文章：Understand Graph Attention Network。途中遇到問題，把找到的解法記錄下來，給也有一樣問題的朋友參考。正文在Colab直接使用： !p

#深度學習 #colab #Colab

Learn AI 不 BI

2024/08/10

AI說書 - 從0開始 - 125 | 第五章目錄

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在某些情況下，別人提供的 Pretrained Transformer Model 效果不盡人意，可能會想要自己做 Pretrained Model，但是這會耗費大量運

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/08/05

AI說書 - 從0開始 - 115 | Google Trax 載入預訓練權重

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型。現在我們來載入預訓練權重，預訓練的權重包含 Transformer 的智慧

#AI #ai #promptengineering

Karen的沙龍

2024/07/28

【邁向圖神經網絡GNN】Part5: 建構 GNN model 實作 Cora 資料集結點分類任務

本篇文章介紹如何使用PyTorch構建和訓練圖神經網絡（GNN），並使用Cora資料集進行節點分類任務。通過模型架構的逐步優化，包括引入批量標準化和獨立的消息傳遞層，調整Dropout和聚合函數，顯著提高了模型的分類準確率。實驗結果表明，經過優化的GNN模型在處理圖結構數據具有強大的性能和應用潛力。

#GNN #Graph #dropout

Karen的沙龍

2024/07/24