第二部：《深度學習》50/100 小結與測驗：DCGAN 生成人臉圖像 🧑‍🎨 創造屬於自己的虛擬角色！

Hansen W

發佈於AI科技機器學習修煉坊

2025/09/18 更新2025/09/18 發佈閱讀 9 分鐘

AI時代系列(2) 機器學習三部曲: 🔹 第二部：《深度學習 —— 神經網路的革命》

50/100 第五週：📌 生成對抗網路 GAN

50.小結與測驗：DCGAN 生成人臉圖像 🧑‍🎨 創造屬於自己的虛擬角色！

🌟 單元小結總覽：GAN 圖像生成核心篇（41～49）

🥊 41 GAN 對抗思維 G（生成器） vs. D（判別器）➜ 模仿騙子與警察訓練邏輯

🏗 42 生成器與判別器架構➜ G 用轉置卷積生成圖像；D 用卷積學會辨識真假

🎯 43 損失函數與訓練技巧➜ 對抗損失 + 循環一致性 + 模式崩潰的預防

🎨 44 DCGAN 原理與應用➜ 最常見入門架構，擅長生成臉、動漫等圖像

🎯 45 cGAN 有條件生成➜ 結合類別條件（如 0~9），控制生成結果

💅 46 StyleGAN風格革命➜ 高解析度虛擬臉孔、可分層控制樣貌與風格

🐴 47 CycleGAN 圖像轉換➜ 無需配對資料即可進行風格轉換（馬↔斑馬）

⚠ 48 訓練不穩解法➜ 判別器太強會導致 G 無法學習，需技巧調整

🌈 49 娛樂與藝術應用➜ GAN 廣泛應用於漫畫、動畫、虛擬偶像等產業

________________________________________

🧪 單選題測驗（每題皆附解析）

1️⃣ 為什麼 GAN 模型會出現「模式崩潰」？

A. 判別器輸出太慢

B. 使用了 cGAN

✅ C. 生成器只學會產生單一樣式圖像

D. 使用了 CycleGAN

📘 解析：

模式崩潰（Mode Collapse）指的是 G 產生的圖像缺乏多樣性，只重複產出少數固定模式。這常因 G 缺乏有效回饋或過度擬合某些樣本而產生。

________________________________________

2️⃣ 下列哪一項是 Conditional GAN (cGAN) 的特點？

A. 可處理語音轉文字任務

✅ B. 根據類別條件控制生成結果

C. 不需要判別器

D. 使用 Style Transfer 模型

📘 解析：

cGAN 的核心設計是讓 G 和 D 都輸入條件向量 y，例如數字、類別或文字描述，用於生成「指定類別」的圖像。

________________________________________

3️⃣ StyleGAN 中的「前段層」主要控制什麼？

A. 圖像亮度與飽和度

✅ B. 臉型輪廓與大結構

C. 判別真假

D. 輸出圖像解析度

📘 解析：

StyleGAN 採用風格分層控制，前段控制大結構（臉型、構圖），中層控制五官，後層則調整紋理與雜訊。

________________________________________

4️⃣ CycleGAN 最大優勢是什麼？

A. 不需要 GPU

B. 適用於分類任務

✅ C. 不需要成對資料也能進行圖像轉換

D. 可產出語音合成結果

📘 解析：

CycleGAN 使用「循環一致性損失」，讓模型能夠在沒有資料一對一對應的情況下，也能學會風格轉換。

________________________________________

5️⃣ 若訓練時判別器太強會發生什麼？

A. G 的輸出會變漂亮

✅ B. G 無法學習，梯度消失

C. 訓練更穩定

D. 模型變成分類器

📘 解析：

當 D 太強，會使 G 難以得到有用的回饋訊號（梯度幾乎為 0），導致訓練卡住，G 無法改善圖像品質。

________________________________________

🎨 示範任務：用 DCGAN 生成人臉圖像 🧑‍🎨

「創造屬於你的虛擬角色」

✅ Step 1：安裝必要工具

bash

pip install torch torchvision matplotlib

________________________________________

✅ Step 2：建立簡化版生成器

import torch

import torch.nn as nn

from torchvision.utils import make_grid

import matplotlib.pyplot as plt

# 生成器模型

class Generator(nn.Module):

def __init__(self):

super().__init__()

self.main = nn.Sequential(

nn.ConvTranspose2d(100, 128, 4, 1, 0),

nn.BatchNorm2d(128),

nn.ReLU(True),

nn.ConvTranspose2d(128, 64, 4, 2, 1),

nn.BatchNorm2d(64),

nn.ReLU(True),

nn.ConvTranspose2d(64, 3, 4, 2, 1),

nn.Tanh()

)

def forward(self, x):

return self.main(x)

# 初始化模型與隨機輸入

netG = Generator()

z = torch.randn(64, 100, 1, 1) # 批次生成64張圖像

fake_imgs = netG(z).detach()

# 顯示結果

grid = make_grid(fake_imgs, nrow=8, normalize=True)

plt.figure(figsize=(8,8))

plt.axis("off")

plt.title("DCGAN 生成的人臉圖像")

plt.imshow(grid.permute(1, 2, 0).cpu())

plt.show()

________________________________________

🎯 任務挑戰：

1. 將 ConvTranspose2d 結構擴展，使圖像解析度變為 64x64。

🛠 方法：

疊加更多層 nn.ConvTranspose2d，並調整 stride=2、padding=1、kernel_size=4

典型流程：

z → 4×4 → 8×8 → 16×16 → 32×32 → 64×64

2. 調整 z 的向量值（如改變標準差），觀察圖像風格是否有變化。

🔍 實驗方式：

原本 z ~ N(0, 1)

改為 z ~ N(0, 0.5)（較集中）或 z ~ N(0, 2)（較分散）

🎨 觀察結果：

較小 std → 圖像變得一致、保守、細節少

較大 std → 圖像風格多樣性上升，但也可能不穩定、失真

有助於探索潛在空間風格邊界

3. 使用 CelebA 或 FFHQ 預訓練模型微調結果，生成更高品質虛擬角色。

📦 操作建議：

下載 StyleGAN2 的 CelebA-HQ / FFHQ 預訓練模型

使用少量新資料進行微調（fine-tune），調整 W 空間分布

或固定生成器，僅訓練映射網路（projection）加快收斂

🎯 效果：提升人物五官自然度、細節紋理與一致性，更適合用於虛擬偶像、個人化角色生成

Hansen W的沙龍AI科技機器學習修煉坊

留言

留言分享你的想法！

Hansen W的沙龍

20會員

520內容數

AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台，主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例，更強調理性思維與行動力的結合。無論你是AI初學者、創業者，還是追求人生升維的行者，都能在這裡找到前進的方向與志同道合的夥伴。

Hansen W的沙龍的其他內容

2025/09/18

第二部：《深度學習》49/100 GAN 在娛樂與藝術的應用 🌈 從漫畫到虛擬偶像都靠它！

GAN 正在改變娛樂與藝術產業，應用於漫畫上色、虛擬偶像、遊戲場景生成、數位服裝與音樂創作。它不僅節省創作者時間，更成為 AI 與人類共創的核心工具。

2025/09/18

第二部：《深度學習》49/100 GAN 在娛樂與藝術的應用 🌈 從漫畫到虛擬偶像都靠它！

2025/09/18

第二部：《深度學習》48/100

GAN 訓練易因判別器過強失衡，導致模式崩潰與梯度消失。可用 Label Smoothing、WGAN、Gradient Penalty 等方法平衡對抗，並透過正規化與可視化監控提升生成品質。

2025/09/18

第二部：《深度學習》48/100

2025/09/18

第二部：《深度學習》47/100 CycleGAN 圖像轉換應用 🐴→🐓 圖像風格無縫變換！

CycleGAN 是無監督圖像轉換模型，透過循環一致性損失實現跨風格轉換，如馬變斑馬、白天變夜晚、素描變照片。其優點是無需成對資料即可保持語意一致，廣泛應用於藝術風格化、濾鏡、建築模擬，但在風格差異大時可能失真或模糊。

2025/09/18

第二部：《深度學習》47/100 CycleGAN 圖像轉換應用 🐴→🐓 圖像風格無縫變換！

看更多

你可能也想看

Life捧烹_王小姐的日常療癒所

氣味同步生活： Sunkronizo淡香精的知性魅力

臺灣獨立調香師品牌 Sunkronizo，Friday : Sexy Vibe 淡香精，揉合威士忌、菸草、皮革、蜂蜜與花香的多層次魅力，讓知性自信與內斂的從容態度，從視覺、嗅覺都充分表現。

#香氛#香水#香水評論

2025/11/25

Life捧烹_王小姐的日常療癒所

氣味同步生活： Sunkronizo淡香精的知性魅力

#香氛#香水#香水評論

2025/11/25

花神沒有咖啡館的沙龍

在VOD黃金時代打造「台流」——隨選串流服務與政策制度、消費行為和演算法的關係

使台劇得以突破過往印象中偶像劇、鄉土劇等範疇，產製更多類型，甚至紅到國外、帶動台灣觀光的最重要原因，便是「隨選串流平台」服務在近十年的蓬勃發展，台灣人愛看串流的程度或許比你我想像中都高，高到連美國電影協會（MPA），都委託Frontier Economics進行研究

#電影產業#全球在地化#串流平台

2025/11/24

花神沒有咖啡館的沙龍

在VOD黃金時代打造「台流」——隨選串流服務與政策制度、消費行為和演算法的關係

#電影產業#全球在地化#串流平台

2025/11/24

月刊龍貓大王通信

進入串流大戰第二階段！台灣影視作品如何透過全球VOD平台對外發聲？這是來自美國電影協會的觀察

本文探討串流平臺（VOD）如何徹底改變好萊塢和臺灣影視產業的生態。從美國電影協會（MPA）的數據報告，揭示串流服務在臺灣的驚人普及率與在地內容的消費趨勢。文章分析國際作品如何透過在地化元素開拓新市場。同時，作者也擔憂政府過度監管可能扼殺臺灣影視創新自由，以越南為鑑，呼籲以開放態度擁抱串流時代的新機遇

#電影產業#全球在地化#串流平台

2025/11/24

月刊龍貓大王通信

進入串流大戰第二階段！台灣影視作品如何透過全球VOD平台對外發聲？這是來自美國電影協會的觀察

#電影產業#全球在地化#串流平台

2025/11/24

普普文創

【文創漫談】美女 | 型態 | AI生成

研究AI生成美女圖像研究AI生成美女圖像是一個很有趣的方向，特別是對於喜歡速寫但很少畫美女的我來說。AI生成圖像的技術不僅可以幫助創作出我心中所想的形象，還可以作為靈感的來源，讓我在速寫中嘗試新的風格和主題。基於大量的數據訓練 AI生成的圖像通常基於大量的數據訓練，可以創造出各種不同風格和

2024/08/12

2024/08/12

這是一篇介紹如何使用AI來生成貓貓圖片的文章，作者透過幾個軟體的使用經驗，分享了AI生成圖片的效果以及注意事項。文章內容豐富，並且有各種關鍵字和描述，可以吸引潛在讀者。

2024/07/30

2024/07/30

LivePortrait 讓靜態人物照片具有生動表情

創建虛擬角色想要賦予生動表情，或是讓歷史人物更變得栩栩如生，利用 AI 模型即可將靜態人物照片變成擁有表情的動態影像。LivePortrait AI 模型可以分析影片中的人物表情，並將其套用至靜態照片，產生具有與影片人物相同表情的動態人像。

#AI照片轉影片#AI生動人物#AI模型

2024/07/20

逍遙資訊

LivePortrait 讓靜態人物照片具有生動表情

#AI照片轉影片#AI生動人物#AI模型

2024/07/20

原來可以這樣做沙龍

如何利用聊天機器人找繪圖靈感

AI 繪圖的浪潮席捲而來，如何在沒有靈感時使用聊天機器人找到靈感？此篇分享如何透過ChatGPT來尋求AI幫助生成創意點子，並分享了實例、圖像生成和創作過程。

2024/07/11

2024/07/11

心情繪本｜SD-WebUI｜你都怎麼用生成式圖像工具呢？

生成式AI工具即將邁入三年，除了ChatGPT以外，也進化了許多GenAI工具，如Sora影片生成等。你知道Stable Diffusion嗎？從詠唱魔法師Prompts的玩家或職務，AI浪潮持續推進下，SD-WebUI並沒有停滯或被淘汰。結果告訴了我們一件事情...

#生成式AI#ChatGPT#數位

2024/06/14

D&Y熊繪生的沙龍

心情繪本｜SD-WebUI｜你都怎麼用生成式圖像工具呢？

#生成式AI#ChatGPT#數位

2024/06/14

原來可以這樣做沙龍

輕鬆五步驟，從靈感發想到完成作品

介紹如何使用AI生成圖像的五個步驟，包括選擇主題、強化主角形象、使用ChatGPT輸入提示句子、AI生成圖像工具生成、以及使用增強畫質的生成工具。

#ChatGPT#分享#創作

2024/05/22

原來可以這樣做沙龍

輕鬆五步驟，從靈感發想到完成作品

介紹如何使用AI生成圖像的五個步驟，包括選擇主題、強化主角形象、使用ChatGPT輸入提示句子、AI生成圖像工具生成、以及使用增強畫質的生成工具。

#ChatGPT#分享#創作

2024/05/22

小凱的沙龍

生成式 AI 技術: 概念、應用和風險

生成式AI（Generative AI）能夠創造新內容和想法，包括對話、故事、圖像、視訊和音樂等。本文將介紹幾種生成式AI模型，以及其在設計製造、教育、客戶服務、媒體與娛樂、市場營銷領域的應用和風險。然後就生成式AI的應用，設計製造、教育、客戶服務、媒體與娛樂、市場營銷等相關領域提供了一些示例。

2024/05/19

2024/05/19

DeepAI 多角色聊天機器人與圖像生成，點燃你的創意火花

DeepAI 提供「聊天機器人」及「生成圖像」兩種服務，不用註冊就可以免費使用，聊天機器人有多種角色做選擇，能為你的創作和思考過程帶來新的靈感；至於圖像生成功能，也提供多種風格供你選擇，讓你每次生成的圖像都有不同的風格和特色。

#AI繪圖#AI#AIGC

2024/03/16

原來可以這樣做沙龍

DeepAI 多角色聊天機器人與圖像生成，點燃你的創意火花

#AI繪圖#AI#AIGC

2024/03/16

Raphael AI 科學家

GAN：生成逼真假照片的秘密武器

現AI時代我們常見的生成影像是如何製作出來的，或許你已經開始熟悉AI“假臉”的風格。但由于現在網路上大量流傳的多數是以DALL-E或是Stable Diffiusion+幾個特定的LoRA所生成的結果。以至於人們越來越有識別真假照片的能力。但或許你不知道的是，早在幾年前純粹用GAN生成技術所產出的人

2024/03/10

2024/03/10

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News