付費限定

方格精選

門外漢的影像轉譯（Image-to-Image Translation）

Rene Wang

發佈於翻滾吧！駭客女孩！

更新於 2020/07/15發佈於 2020/07/09閱讀時間約 2 分鐘

影像轉譯演算法們以及他們的損失函式分解一覽圖。y-axis 是損失項的種類， x-axis 則是該損失項的係數，用來代表該損失項的相對重要性。

上圖為本文提到的影像轉譯演算法們以及他們的損失函式分解一覽圖。如果想知道更多關於影像轉譯演算法，請繼續閱讀。

在影像生成的領域中，其中一個富有挑戰的是影像對影像的轉譯（image to image translation）問題。取決於問題的設計，需要兩組各自屬於不同領域（domains）的影像集作為輸入。這兩組影像集，根據轉譯的方向，可以分別稱為來源影像集，以及目標影像集。影像轉譯是透過模型學習來源和目標影像集之間的映射關係，給定一個來源影像作為輸入，模型則生成一個符合目標領域分佈的影像。

提到生成影像的模型，在深度學習中快速獲得大眾歡迎的生成對抗網路（Generative Adversarial Network），簡稱為 GAN。架構上為兩個網路，一個是 Generator，另一個則是 Discriminator。兩個網路共同最佳化一個損失函示，只是最佳化的方向相反。

Outline:

Conditional GAN (cGAN)

Mode Collapse

Paired Image-to-Image

Unpaired image-to-image

Cycle Consistency

Attention-Guided Methods

Normalization

以行動支持創作者！付費即可解鎖

本篇內容共 14889 字、0 則留言，僅發佈於翻滾吧！駭客女孩！你目前無法檢視以下內容，可能因為尚未登入，或沒有該房間的查看權限。

Rene Wang的沙龍翻滾吧！駭客女孩！

留言

留言分享你的想法！

Rene Wang的沙龍

70會員

35內容數

<p>專為年輕的女孩設計的科學／資訊科技寫作計畫，希望讓每位女孩在體脂肪、青春痘與暗戀對象之外，還能找到新的生活樂趣。</p>

Rene Wang的沙龍的其他內容

2021/03/19

[探索] 語言模型基礎：Subword algorithms

一個好的自然語言模型，若出現了語言模型的 vocabulary set 未曾收錄的單字，語言模型就會產生 Out-of-Vocabulary (OOV)。本文介紹 subword algorithms 介於 word-level 和 character-level 解決 OOV 的方法。

2021/03/19

[探索] 語言模型基礎：Subword algorithms

2021/02/26

網路裁減（Network Pruning）和解構樂透彩卷假說

本篇文章前半段先對網路裁減做簡單介紹，後半段針對彩卷假說作文獻式的探討。網路裁減是一種重新發現等價小網路的方法，主要目的在為 over-parameterized 的方式訓練而成的類神經網路提供一個精簡版的網路，有助於在資源受限的平台上運行。彩卷假說則是探討權重初始值和網路裁減之間的關係。

2021/02/26

網路裁減（Network Pruning）和解構樂透彩卷假說

2021/01/08

[探索] 使用 Mixture of Experts 建立多任務學習框架

多任務學習指的是使用多個相關的任務目標（Multiple objectives）來學習共享的表示方法。在這篇文章中，我們會介紹 google 的 youtube recommender 系統就是利用 Multi-gate Mixture of Experts 來達成多目標多任務學習的方式。

2021/01/08

[探索] 使用 Mixture of Experts 建立多任務學習框架

看更多

你可能也想看

方格子 vocus 官方沙龍

沙龍介面新登場！自訂你的創作空間，讓好內容被看見

沙龍一直是創作與交流的重要空間，這次 vocus 全面改版了沙龍介面，就是為了讓好內容被好好看見！你可以自由編排你的沙龍首頁版位，新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。改版完成後可以在社群媒體分享新版面，並標記 @vocus.official⁠ ♥️ ⁠

#vocus#方格子#方格子沙龍

2025/06/12

方格子 vocus 官方沙龍

沙龍介面新登場！自訂你的創作空間，讓好內容被看見

#vocus#方格子#方格子沙龍

2025/06/12

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

每年4月、5月都是最多稅要繳的月份，當然大部份的人都是有機會繳到「綜合所得稅」，只是相當相當多人還不知道，原來繳給政府的稅！可以透過一些有活動的銀行信用卡或電子支付來繳，從繳費中賺一點點小確幸！就是賺個１%~2%大家也是很開心的，因為你們把沒回饋變成有回饋，就是用卡的最高境界所得稅線上申報

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

螃蟹_crab的沙龍

[深度學習][Python]DCGAN訓練生成手寫阿拉伯數字_訓練篇

本文參考TensorFlow官網Deep Convolutional Generative Adversarial Network的程式碼來加以實作說明。示範如何使用深度卷積生成對抗網路(DCGAN) 生成手寫數位影像。

#深度學習#DCGAN#DCGAN生成手寫阿拉伯數字

2024/07/27

螃蟹_crab的沙龍

[深度學習][Python]DCGAN訓練生成手寫阿拉伯數字_訓練篇

本文參考TensorFlow官網Deep Convolutional Generative Adversarial Network的程式碼來加以實作說明。示範如何使用深度卷積生成對抗網路(DCGAN) 生成手寫數位影像。

#深度學習#DCGAN#DCGAN生成手寫阿拉伯數字

2024/07/27

螃蟹_crab的沙龍

[深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇

延續上一篇訓練GAM模型，這次我們讓神經網路更多層更複雜一點，來看訓練生成的圖片是否效果會更好。 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇資料集分割處理的部分在延續上篇文章，從第五點開始後修改即可，前面都一樣訓練過程，比較圖是不是CNN的效果比MLP還要好，

#CNN的GAN模型#Python#深度學習

2024/07/26

螃蟹_crab的沙龍

[深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇

#CNN的GAN模型#Python#深度學習

2024/07/26

螃蟹_crab的沙龍

[深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇

本文主要介紹，如何利用GAN生成對抗網路來訓練生成圖片。利用tensorflow，中的keras來建立生成器及鑑別器互相競爭訓練，最後利用訓練好的生成器來生成圖片。 GAN生成對抗網路的介紹它由生成網路(Generator Network)和鑑別網路(Discriminator Netwo

#GAN#生成對抗網路#生成器

2024/07/25

螃蟹_crab的沙龍

[深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇

#GAN#生成對抗網路#生成器

2024/07/25

柴郡貓姍蒂的沙龍

筆記-深度學習論文閱讀：Deep Residual Learning for Image Recognition

前言在閱讀《強化式學習：打造最強 AlphaZero 通用演算法》時，文中介紹了殘差網路，並推薦了兩篇論文；因為在看了書後，對殘差網路的概念還是不很清楚，於是決定用ChatGPT翻譯這兩篇論文來增強理解，以下正文是第一篇論文：Deep Residual Learning for Image Re

#深度學習#人工智慧#殘差網路

2024/07/07

柴郡貓姍蒂的沙龍

筆記-深度學習論文閱讀：Deep Residual Learning for Image Recognition

#深度學習#人工智慧#殘差網路

2024/07/07

仁和的論文整理

AI影像論文(03)：U-Net 論文筆記整理

U-Net演算法架構解析，首次介紹了U-Net的設計，架構，以及在Stable-diffusion中的應用。詳盡分析了U-Net的收縮路徑、擴展路徑、最終層，以及形變不變性的應用。同時提供了相關論文以及PyTorch實作的參考資料。

#路徑#模型#論文

2024/07/03

仁和的論文整理

AI影像論文(03)：U-Net 論文筆記整理

#路徑#模型#論文

2024/07/03

dab戴伯的沙龍

生成式對抗網路GAN

這篇文章探討了生成式對抗網路中機率分佈的使用與相關的訓練方式，包括Generator不同的點、Distriminator的訓練過程、生成圖片的條件設定等。此外，也提到了GAN訓練的困難與解決方式以及不同的learning方式。文章內容豐富且詳細，涵蓋了GAN的各個相關面向。

2024/05/15

2024/05/15

對抗擴散生成蒸餾(ADD) 讓生成模型快又有效

Stability AI在圖片/影片/聲音生成領域貢獻了不少心力，近期提出了更加高效率的對抗生成蒸餾方法，只需進行一步計算，便能打敗LCM需要4步計算的結果，來看看具體是如何做到的。

#對抗生成模型#對抗生成蒸餾#StabilityAI

2023/12/20

無限智慧學院的沙龍

對抗擴散生成蒸餾(ADD) 讓生成模型快又有效

#對抗生成模型#對抗生成蒸餾#StabilityAI

2023/12/20

Karen的沙龍

LLM 串連：利用不同模型的優勢完成更複雜和多樣的任務

前言在先前的文章中，我們探討了 IBM Watsonx 在客戶滿意度分析中的應用。今天，我們將利用 Google 的兩款大型語言模型（LLM）— flan-ul2 和 flan-t5-xxl，展示它們如何串聯起來生成關於特定主題的隨機問題和回答。在這篇文章中，將使用 SimpleSequen

#模型#LLM#IBM

2023/12/18

Karen的沙龍

LLM 串連：利用不同模型的優勢完成更複雜和多樣的任務

#模型#LLM#IBM

2023/12/18

Ted Chen的沙龍

生成式學習的兩種策略：各個擊破還是一次到位

本文介紹了生成式學習中的兩種策略：「各個擊破」和「一次到位」。這兩種策略在生成速度和品質之間達到平衡。為了提高速度，可以採用"N次到位"的Diffusion Model策略。在語音和影像生成中，可以結合這兩種策略以充分利用優勢。融合策略可以同時確保品質和速度，展現人工智慧的潛力。

#生成式學習#語音生成#影像生成

2023/06/05

Ted Chen的沙龍

生成式學習的兩種策略：各個擊破還是一次到位

#生成式學習#語音生成#影像生成

2023/06/05

深智數位的沙龍

【深智書摘】AI 2.0 - 5年前出現的TF接班人—JAX—重磅出世

在AI已經全民運動的年代，Google還是希望有一個更小巧精美的深度學習套件讓大家都能快速上手──JAX就這麼誕生了。現在，你真的可以放心的進入JAX的世界，當你上手之後，不論是CNN、RNN、NLP或是GAN，全部可以又快又好又清楚的做出來

#GPU#Google#Tensor

2023/02/23

深智數位的沙龍

【深智書摘】AI 2.0 - 5年前出現的TF接班人—JAX—重磅出世

#GPU#Google#Tensor

2023/02/23

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News