圖像風格轉換(一)-風格轉換初探

更新於 發佈於 閱讀時間約 2 分鐘

一.引言

  最近遇到一些人想做音訊的合成,我回答他或許可以從圖像風格轉換中找到些靈感,我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何,對於內部訓練邏輯及結構並沒有認真的去了解,現在剛好趁此機會好好的學習一下。

二.圖像風格說明

  對於圖像風格轉換,可以往前推至 Gatys et al. 2015 的 A Neural Algorithm of Artistic Style 這篇論文,當中提出了使用 VGG16/19 作為特徵擷取層,最終達成了單次單張圖像的風格轉換。

  首先,我們來說明一下為什麼能做到風格轉換,在這篇論文中,將風格轉換問題視為一個對圖同時進行<內容>及<風格>的優化,希望一張圖在特徵擷取後的特徵,與分別對內容圖及風格圖進行相同的特徵擷取後的結果進行相關性計算,若兩者都收斂,及代表該圖同時保有內容圖的風格圖的內容。

  這是一個有趣的方向,因為與目前通常的使用來說,優化的通常是模型本身,而這邊採取的是優化圖像,模型是不用進行參數更新的,接下來會簡單介紹整體訓練流程 :

三.實際演練

首先先定義出內容圖像及風格圖像,這邊就用我的拉拉肥及五條來試試

raw-image

  在訓練時,會持續使用這兩張圖像計算 Content Loss 及 Style Loss ,以下為簡易流程圖。

raw-image

  至於最重要的 Loss 方面,Content Loss 採用 MSE 進行兩張圖內容上的相似度判斷,而 Style Loss 方面,因為需要凸顯出風格,所以是採用 Gram 矩陣的方式,所謂的Gram 矩陣是將特徵向量與自己的轉置相乘,最終獲取的矩陣可以理解成不同特徵的相關響應,且忽略它們在圖像中的具體位置,這樣的方式能好好的抓住風格的本質──紋理與視覺模式的總體分布。

  以下為實際的結果,實際實驗時可以嘗試調整優化器,原論文中的LBFGS雖然收斂很快,但有機率梯度爆炸,若調整成 Adam 雖然收斂變慢,但可以穩定的的收斂,若想看到逐漸變化的過程,使用 Adam 會是一個好辦法。

raw-image

四.結語

  本次實驗的風格轉換確實是個有趣的方式及方向,但缺點也很明顯,因為訓練的是圖像本身,意味著生成一張圖像都得重新經過訓練,沒有記憶功能,且結果稍不可控,但這方法也奠基的一個風格轉換的基礎,我接下來會逐步介紹接下來的變體。

另外本次實作程式碼也同步更新於Github

avatar-img
8會員
21內容數
AI、電腦視覺、圖像處理、AWS等等持續學習時的學習筆記,也包含一些心得,主要是幫助自己學習,若能同時幫助到不小心來到這裡的人,那也是好事一件 : )
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
初來這個網站 放一些以前畫的,有關音樂的圖
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
1 文字之後補充 2 3 4 5
Thumbnail
其實,好好看看別人發布的作品,然後仿製,再做出屬於自己的畫作,這個過程真的很有意思! 我今天就看了別人的作品,改一下提示詞(咒語),玩得很高興。 1.在別人的 Post 裡面找個順眼的圖案... 下圖是舉例的,現在我已經捲不到我之前真正的參考圖案了,所以,有時候還是靠緣分啦。
Thumbnail
這個專欄分享了除了PV影片之外,自己學習或創作的其他經歷,包括自製頭像的設計和繪製過程。作者分享了創作的初版草稿、上色過程以及根據意見修改的過程。
Thumbnail
主題發想 : 傳統與現代的融合。 創作理念 : 表達古典元素和現代設計之間的和諧共存之創新藝術。
Thumbnail
前篇測試如何把提示詞生成的圖像細節提高,這篇要測試的工作流是把任意圖像載入後經由放大模型放大,同時測試放大後重繪看看效果如何。
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
初來這個網站 放一些以前畫的,有關音樂的圖
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
1 文字之後補充 2 3 4 5
Thumbnail
其實,好好看看別人發布的作品,然後仿製,再做出屬於自己的畫作,這個過程真的很有意思! 我今天就看了別人的作品,改一下提示詞(咒語),玩得很高興。 1.在別人的 Post 裡面找個順眼的圖案... 下圖是舉例的,現在我已經捲不到我之前真正的參考圖案了,所以,有時候還是靠緣分啦。
Thumbnail
這個專欄分享了除了PV影片之外,自己學習或創作的其他經歷,包括自製頭像的設計和繪製過程。作者分享了創作的初版草稿、上色過程以及根據意見修改的過程。
Thumbnail
主題發想 : 傳統與現代的融合。 創作理念 : 表達古典元素和現代設計之間的和諧共存之創新藝術。
Thumbnail
前篇測試如何把提示詞生成的圖像細節提高,這篇要測試的工作流是把任意圖像載入後經由放大模型放大,同時測試放大後重繪看看效果如何。