讓我們談一下「以圖生圖」

2024/12/12 更新2024/12/11 發佈閱讀 6 分鐘

什麼是深度學習？

深度學習是一種讓電腦「自我學習」的技術。傳統上，我們需要告訴電腦該注意哪些特徵，但深度學習不需要人為指定。首先，你餵給電腦非常多的圖片，它會一步步學會區分：哪裡是邊緣、哪裡是顏色、怎麼判斷物體是貓還是狗。經過大量資料的訓練，電腦會在自己的「腦袋」（即多層神經網路）裡調整很多數字，最後它就能自動從雜亂的資訊中找出規律，達到分類、辨識，甚至創造新東西的能力。

什麼是生成式模型？

生成式模型是深度學習中的一種特別工具。以前的電腦只能辨識「這是什麼」，但生成式模型還能「做出新的東西」。它們從學到的資料中，了解怎麼畫出類似但不一樣的圖像。比如說，如果它看過很多貓的照片，它就能自己憑空「畫」出一張從沒出現過的貓圖。這種模型不是在複製，而是根據過去學到的特徵，創造新作品。

以圖生圖的應用

「以圖生圖」就是你給電腦一張原圖，它能「聽懂」你的指令，把原圖變成全新風格的圖片。比方說，你給電腦一張自己的大頭照，並要求「幫我變成休閒風格的我」，電腦就能運用它所學到的規則，把你的臉換成像休閒風格的圖片了。

以圖生圖的體驗：A1 art

最近有一個網站很夯，他叫做 A1.art (是數字1，而不是 AI art 喔)，他就是利用「以圖生圖」概念的好例子。你只要先上傳自己的大頭照，然後你自己從他的2000多種模板當中挑出一種洗ㄏ風格，A1.art 的 AI 系統就能把將你的大頭照重新「畫」一張出來，讓你的臉用完全不同的美術風格呈現。透過深度學習和生成式模型的力量，A1.art 讓一般人不用懂程式或繪圖技巧，也能輕鬆把想法變成精緻又有創意的新圖像。

可以將整個過程簡化為以下三個步驟：

特徵萃取：
當你上傳一張臉部照片，AI 首先會透過已訓練的深度神經網路分析該圖像，抓取臉部特徵（如眼睛、鼻子、嘴巴、臉形結構等）。這個步驟就像在「讀」你的臉，把重要的五官資訊轉化為電腦能理解的數字特徵。
風格轉移：
接著，AI 會參考你所選擇的風格（例如：卡通、油畫、科幻風）。透過特定的生成式模型，系統把剛剛萃取到的臉部特徵套用到這個風格「框架」裡，並開始重新「繪製」你的臉部特徵，使之呈現出新風格的視覺效果。
圖片生成：
最後，AI 將整合特徵資訊與風格設定，生成一張全新圖片，並保有你的五官特點。這一張完成品正是「以圖生圖」的成果，也就是 A1.art 等類似服務所提供的轉換成品。

同學們可以自己實作看看，例如：

想要3D卡通版的自己，在瀏覽器輸入 a1.art/h6iz，或直接點連結。
想要上班族的自己，在瀏覽器輸入 a1.art/hy5g，或直接點連結。
想要打棒球的自己，在瀏覽器輸入 a1.art/hev5，或直接點連結。

想要木炭畫風的自己，在瀏覽器輸入 a1.art/sep7，或直接點連結。
想要超人公仔的自己，在瀏覽器輸入 a1.art/2b5q，或直接點連結。
想要跟名車合照的自己，在瀏覽器輸入 a1.art/n2al，或直接點連結。

想要拿耶誕禮物的自己，在瀏覽器輸入 a1.art/nf3n，或直接點連結。
想要穿西裝打領帶的自己，在瀏覽器輸入 a1.art/ys2j，或直接點連結。
想要日式漫畫美學JOJO風格的自己，在瀏覽器輸入 a1.art/2y5v，或直接點連結。

媽呀！有的根本不像我

即使你用同一張大頭照，但畫出來的可能會有很大差異。這是什麼問題呢？既然是同一個AI，用的就是相同的特徵萃取與風格轉換技術，但實際生成結果卻可能出現「不穩定」的情況，原因包括：

模型的隨機性：
生成式模型在產圖時常有隨機因素，因此每次生成的細部可能略有差異。即使同樣的臉部特徵與同樣的風格設定，每次運算都可能產生些微不同的結果。
風格複雜度：
有些風格模板相對簡單，模型容易準確再現你的特徵；但某些風格過於抽象、誇張或細節複雜，模型在重繪時更有可能「走樣」，導致臉部特徵呈現不如預期地一致。
特徵匹配度：
模型萃取你的臉部特徵並嘗試將它映射到指定風格中，有時特定的臉部特徵與所選風格的「特徵要求」相差較大，使模型要維持相似度變得困難。

如何讓AI將你畫得更像？

不知道你有沒有注意到，LINE也有推出一個類似的服務，叫做「個人檔案工作室」，他宣稱只要上傳自己在不同角度、不同光線條件和臉部表情有些微不同的8~12張大頭照，就可以幫你生出20張攝影棚品質的AI證件照。他就是想要讓 AI 有足夠「材料」去精煉你的臉部特徵，進而產出貼近專業攝影水準的證件照。

臉部特徵的完整掌握：
多角度、多光線和不同微表情的照片，讓 AI 能更全面地了解你的五官特徵，確保最後生成的證件照更像「真實的你」。
降低失真與走樣風險：
光用一兩張照片，模型可能在生成過程中失去某些臉部細節或特徵比例。多張照片提供更豐富的臉部資訊，使 AI 能更精準地還原你的臉型、膚色、輪廓，減少生成圖像出現怪異比例或不自然變形的情況。
提升影像品質與細緻度：
有了更多參考資料，AI 可以更自信地對你的臉部特徵做微調，同時套用攝影棚級的光影與細節處理，使生成的證件照不僅清晰、自然，還帶有專業感。
提高一致性與可重現性：
多張訓練照片讓 AI 對你的臉部特性形成較穩定的「內部模型」，之後不論生成多少張照片，都能保持在同一風格與水準，品質不易忽上忽下。

留言

楊老師AI365 | 生成式AI職場應用

96會員

77內容數

歡迎來到楊老師的生成式AI沙龍！這裡輕鬆帶你掌握GenAI的基礎概念，透過生活化案例幫助你了解AI如何影響工作與創造價值。我也會分享多年教學與輔導經驗，帶你掌握AI國際認證的考試技巧與學習心法。更重要的是，從教育、美容、製造、銷售等百工百業出發，帶你一步步認識各行各業如何實際導入AI，成為這波數位轉型浪潮中的領航者！

楊老師AI365 | 生成式AI職場應用的其他內容

2025/04/26

IPAS AI應用規劃師【L12 生成式 AI 應用與規劃】模擬考(D卷)

L12「生成式 AI 應用與規劃」的評鑑主題及評鑑內容如下： L121 No code / Low code概念、L122 生成式 AI 應用領域與工具使用、L123 生成式 AI 導入評估規劃楊老師針對以上三個評鑑主題裡面的評鑑內容進行命題，僅供考生參考，大家加油！

2025/04/26

IPAS AI應用規劃師【L12 生成式 AI 應用與規劃】模擬考(D卷)

2025/04/26

IPAS AI應用規劃師【L12 生成式 AI 應用與規劃】模擬考(C卷)

L12「生成式 AI 應用與規劃」的評鑑主題及評鑑內容如下： L121 No code / Low code概念、L122 生成式 AI 應用領域與工具使用、L123 生成式 AI 導入評估規劃楊老師針對以上三個評鑑主題裡面的評鑑內容進行命題，這份考卷難度有提升一點，僅供考生參考，大家加油！

2025/04/26

IPAS AI應用規劃師【L12 生成式 AI 應用與規劃】模擬考(C卷)

2025/04/26

IPAS AI應用規劃師【L12 生成式 AI 應用與規劃】模擬考(B卷)

2025/04/26

IPAS AI應用規劃師【L12 生成式 AI 應用與規劃】模擬考(B卷)

看更多

你可能也想看

如果生活不簡單，那心態要簡單。的沙龍

嘗試 | Fotor AI圖像創作

會想要AI 幫把我腦海中的圖像誕生出來的原因，可以省下時間找符合心中元素的圖片外，也能避免找了好久後，才發現圖片需要授權，又得花時間註冊付費，又或者圖片的版權不清楚等困擾。

2023/08/13

2023/08/13

【Hugging Face】Ep.7 以文生圖的魔幻製圖師(Text To Image)

我們過往介紹了幾個關於文字AI應用的篇章：【Hugging Face】Ep.5 文字世界中的超能力語言英雄(Named Entity Recognition) 【Hugging Face】Ep.6 解決問題的專業級破關知識家(Question Answering) 但單獨的文字應用似乎不太能

#AI#AI創作#技術組

2023/07/31

阿Han的沙龍

【Hugging Face】Ep.7 以文生圖的魔幻製圖師(Text To Image)

#AI#AI創作#技術組

2023/07/31

Homer的沙龍

應用Midjourney的實際案例：AI生成平面向量圖，美化你的作品集網站

每次找圖片時翻遍了整個網站都找不到一張適合的圖，倒不如自己做……等等，這不就是AI能辦到的嗎？沒錯，本篇文章就是要與大家分享，如何利用 AI 生成圖片，打造自己的圖片素材庫！

#商業#客製化#Midjourney

2023/08/07

Homer的沙龍

應用Midjourney的實際案例：AI生成平面向量圖，美化你的作品集網站

#商業#客製化#Midjourney

2023/08/07

Amber Chang的沙龍

【AI繪圖】3大最好用AI繪圖網站推薦！3分鐘讀懂AI繪圖

AI繪圖在繪畫、攝影、及影片製作領域中已成為不可忽視的技術，了解AI繪圖趨勢並善用線上AI繪圖生成器及畫質修復軟體，幫助你輕鬆打造高品質AI生成照片。

#AI繪圖#數位工具#視覺設計

2023/11/23

Amber Chang的沙龍

【AI繪圖】3大最好用AI繪圖網站推薦！3分鐘讀懂AI繪圖

#AI繪圖#數位工具#視覺設計

2023/11/23

Eileen Chen的沙龍

生成式 AI：未來的日常生活

　　當你想到人工智能，也許會想到科幻電影裡那些高智商的機器人。但其實，生成式AI已經在我們的日常生活扮演了一個不那麼引人注目但日益重要的角色。從在社群媒體上看到的那些有趣的圖片，到那首由AI作詞作曲的歌，生成式AI正在以各種有趣的方式改變我們的世界。ChatGPT就是眾所周知的生成式AI之一。

2023/12/12

2023/12/12

吃完飯後再談道德，除魅之後再復魅：巴里．柯斯基與柏林劇團的《三便士歌劇》

全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼，反而利用華麗的秀場視覺，引導觀眾在晚期資本主義的消費愉悅之中，而能驚覺「批判」本身亦可能被收編——而當絞繩升起，這場關於如何生存的黑色遊戲，又將帶領新時代的我們走向何種後現代的自我解構？

#2026北藝嚴選#BarrieKosky#BerlinerEnsemble

2026/03/10

釀電影，啜一口電影的美好。

吃完飯後再談道德，除魅之後再復魅：巴里．柯斯基與柏林劇團的《三便士歌劇》

#2026北藝嚴選#BarrieKosky#BerlinerEnsemble

2026/03/10

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇：帕拉贊諾夫的十段殘篇》，如何以十段殘篇，結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭，探討藝術在儀式消失的現代社會如何承接意義，並展現不羈的自由靈魂。

#釀電影#釀評論#藝術評論

2026/02/11

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

#釀電影#釀評論#藝術評論

2026/02/11

技術PM路易斯的沙龍

讓AI幫你成為超級英雄 — 談怎麼用自己的照片來做AI繪圖

今天我這邊提供大家一個方法，讓大家可以自己成為這些AI繪圖的主角，也就是在AI裡面建立屬於你自己個人的模型。Stable Diffusion比較少這部分的教學，是因為這部分的訓練的確比較有一些技術的門檻，我這邊會嘗試用比較簡單的方式讓大家可以一個步驟一個步驟照著做，就能夠達到我們想要達到的結果。

#AI繪圖#AI#StableDiffusion

2023/05/19

技術PM路易斯的沙龍

讓AI幫你成為超級英雄 — 談怎麼用自己的照片來做AI繪圖

#AI繪圖#AI#StableDiffusion

2023/05/19

莎SA的沙龍

手繪與AI繪畫｜美圖秀秀軟體

在科技的浪潮下，享受科技帶來的方便感，且有效率及完美的完成事項，讓生活變得更有活力。生活，就是探尋及享受其中的驚喜與樂趣!

#AI繪圖#創作#美圖秀秀

2023/06/18

莎SA的沙龍

手繪與AI繪畫｜美圖秀秀軟體

在科技的浪潮下，享受科技帶來的方便感，且有效率及完美的完成事項，讓生活變得更有活力。生活，就是探尋及享受其中的驚喜與樂趣!

#AI繪圖#創作#美圖秀秀

2023/06/18

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

長期以來，西方美學以《維特魯威人》式的幾何比例定義「完美身體」，這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯．奧尼奎庫的舞作《轉轉生》，探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

Amily的沙龍

在理解與拒絕之間：從多重身分觀看《海妲．蓋柏樂》

若說易卜生的《玩偶之家》為 19 世紀的女性，開啟了一扇離家的窄門，那麼《海妲．蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆，同為熟稔文本的演員，亦是深刻體察制度縫隙的當代女性，此文所看見的不僅僅是崩壞前夕的最後發聲，更是女人被迫置於冷酷的制度之下，步步陷入無以言說的困境。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28