貓貓學習筆記

圖像風格轉換(一)-風格轉換初探

發佈於AI之路有你有我

更新於 2024/05/06發佈於 2024/05/06閱讀時間約 2 分鐘

一.引言

　　最近遇到一些人想做音訊的合成，我回答他或許可以從圖像風格轉換中找到些靈感，我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何，對於內部訓練邏輯及結構並沒有認真的去了解，現在剛好趁此機會好好的學習一下。

二.圖像風格說明

　　對於圖像風格轉換，可以往前推至 Gatys et al. 2015 的 A Neural Algorithm of Artistic Style 這篇論文，當中提出了使用 VGG16/19 作為特徵擷取層，最終達成了單次單張圖像的風格轉換。

　　首先，我們來說明一下為什麼能做到風格轉換，在這篇論文中，將風格轉換問題視為一個對圖同時進行<內容>及<風格>的優化，希望一張圖在特徵擷取後的特徵，與分別對內容圖及風格圖進行相同的特徵擷取後的結果進行相關性計算，若兩者都收斂，及代表該圖同時保有內容圖的風格圖的內容。

　　這是一個有趣的方向，因為與目前通常的使用來說，優化的通常是模型本身，而這邊採取的是優化圖像，模型是不用進行參數更新的，接下來會簡單介紹整體訓練流程 :

三.實際演練

首先先定義出內容圖像及風格圖像，這邊就用我的拉拉肥及五條來試試

raw-image

　　在訓練時，會持續使用這兩張圖像計算 Content Loss 及 Style Loss ，以下為簡易流程圖。

raw-image

　　至於最重要的 Loss 方面，Content Loss 採用 MSE 進行兩張圖內容上的相似度判斷，而 Style Loss 方面，因為需要凸顯出風格，所以是採用 Gram 矩陣的方式，所謂的Gram 矩陣是將特徵向量與自己的轉置相乘，最終獲取的矩陣可以理解成不同特徵的相關響應，且忽略它們在圖像中的具體位置，這樣的方式能好好的抓住風格的本質──紋理與視覺模式的總體分布。

　　以下為實際的結果，實際實驗時可以嘗試調整優化器，原論文中的LBFGS雖然收斂很快，但有機率梯度爆炸，若調整成 Adam 雖然收斂變慢，但可以穩定的的收斂，若想看到逐漸變化的過程，使用 Adam 會是一個好辦法。

raw-image

四.結語

　　本次實驗的風格轉換確實是個有趣的方式及方向，但缺點也很明顯，因為訓練的是圖像本身，意味著生成一張圖像都得重新經過訓練，沒有記憶功能，且結果稍不可控，但這方法也奠基的一個風格轉換的基礎，我接下來會逐步介紹接下來的變體。

另外本次實作程式碼也同步更新於Github

貓貓學習筆記AI之路有你有我

貓貓學習筆記

9會員

21內容數

AI、電腦視覺、圖像處理、AWS等等持續學習時的學習筆記，也包含一些心得，主要是幫助自己學習，若能同時幫助到不小心來到這裡的人，那也是好事一件 : )

留言

留言分享你的想法！

你可能也想看

Google News 追蹤

方格子 vocus 官方沙龍

「方格人氣王」挑戰賽🏆！發文互動拿禮物，登上首頁曝光！

全新 vocus 挑戰活動「方格人氣王」來啦～四大挑戰任你選，留言 / 愛心 / 瀏覽數大 PK，還有新手專屬挑戰！無論你是 vocus 上活躍創作者或剛加入的新手，都有機會被更多人看見，獲得站上版位曝光＆豐富獎勵！🏆

#方格人氣王 #方格留言王 #方格愛心王

AI 筆記工具大評比：NotebookLM、OneNote、Notion AI 分析

本文探討AI筆記工具的優缺點、選擇建議及未來趨勢，比較NotebookLM、OneNote+Copilot、Notion AI、Obsidian+GPT插件和Palantir Foundry等工具，並強調安全注意事項及個人需求評估的重要性。

#Google #生成 #Note

小蝦壽司迴轉台

《獵人》如何脫離繼承戰？庫洛洛或許能幫忙

全方位分析脫離繼承戰的方法，大膽猜測誰會成為卡丁國下一任國王。

#獵人 #HUNTER×HUNTER #繼承戰懶人包

子不語怪・力・亂・神

Stable Diffusion練習，營火

最近在嘗試使用不同的AI生圖方式混合出圖的方式，採用A平台的優點，並用B平台後製的手法截長補短，創造出自己更想要的小說場景，效果不錯，現在以這張圖為例，來講一下我的製作步驟。

#StableDiffusion #AI繪圖 #插畫

初來這個網站放一些以前畫的，有關音樂的圖

九日的文字廚房

自畫像

#自畫像 #柔繪筆

原來可以這樣做沙龍

從概念到實踐，教你如何運用AI生成來激發視覺和創意

運用生成的AI圖像來激發視覺和創意，無論是生成素材、用在社交媒體上，這些圖像都能為你的的視覺帶來獨特的風格。

#分享 #創作 #AI

雞蛋布丁的沙龍

１文字之後補充２３４５

AI繪圖 18+/R 實驗室

Q版人物或動物試作

其實，好好看看別人發布的作品，然後仿製，再做出屬於自己的畫作，這個過程真的很有意思! 我今天就看了別人的作品，改一下提示詞(咒語)，玩得很高興。 1.在別人的 Post 裡面找個順眼的圖案... 下圖是舉例的，現在我已經捲不到我之前真正的參考圖案了，所以，有時候還是靠緣分啦。

#AI繪圖 #AI繪圖研究日誌 #TensorArt

歐拉熊的小廢文專欄

【 #週二學創作】1 - 客製化頭像繪製 x2

這個專欄分享了除了PV影片之外，自己學習或創作的其他經歷，包括自製頭像的設計和繪製過程。作者分享了創作的初版草稿、上色過程以及根據意見修改的過程。

#創作 #電腦繪圖 #頭像繪製

真師傅的AI沙龍

#融合 Fusion #手做 VS AI

主題發想 : 傳統與現代的融合。創作理念 : 表達古典元素和現代設計之間的和諧共存之創新藝術。

#融合 #Fusion #古典與現代

Frank Hsu的沙龍

ComfyUI 研究 - 任意圖像放大

前篇測試如何把提示詞生成的圖像細節提高，這篇要測試的工作流是把任意圖像載入後經由放大模型放大，同時測試放大後重繪看看效果如何。

#comfyui #StableDiffusion #AI繪圖

《創作者事業研究室》沙龍

【用風格公式法，讓作品源源不絕產出】

【用風格公式法，讓作品源源不絕產出】

#啟發隨想 #風格公式法 #作品

方格子 vocus 官方沙龍

「方格人氣王」挑戰賽🏆！發文互動拿禮物，登上首頁曝光！

全新 vocus 挑戰活動「方格人氣王」來啦～四大挑戰任你選，留言 / 愛心 / 瀏覽數大 PK，還有新手專屬挑戰！無論你是 vocus 上活躍創作者或剛加入的新手，都有機會被更多人看見，獲得站上版位曝光＆豐富獎勵！🏆

#方格人氣王 #方格留言王 #方格愛心王

AI 筆記工具大評比：NotebookLM、OneNote、Notion AI 分析

本文探討AI筆記工具的優缺點、選擇建議及未來趨勢，比較NotebookLM、OneNote+Copilot、Notion AI、Obsidian+GPT插件和Palantir Foundry等工具，並強調安全注意事項及個人需求評估的重要性。

#Google #生成 #Note

小蝦壽司迴轉台

《獵人》如何脫離繼承戰？庫洛洛或許能幫忙

全方位分析脫離繼承戰的方法，大膽猜測誰會成為卡丁國下一任國王。

#獵人 #HUNTER×HUNTER #繼承戰懶人包

子不語怪・力・亂・神

Stable Diffusion練習，營火

最近在嘗試使用不同的AI生圖方式混合出圖的方式，採用A平台的優點，並用B平台後製的手法截長補短，創造出自己更想要的小說場景，效果不錯，現在以這張圖為例，來講一下我的製作步驟。

#StableDiffusion #AI繪圖 #插畫

初來這個網站放一些以前畫的，有關音樂的圖

九日的文字廚房

自畫像

#自畫像 #柔繪筆

原來可以這樣做沙龍

從概念到實踐，教你如何運用AI生成來激發視覺和創意

運用生成的AI圖像來激發視覺和創意，無論是生成素材、用在社交媒體上，這些圖像都能為你的的視覺帶來獨特的風格。

#分享 #創作 #AI

雞蛋布丁的沙龍

１文字之後補充２３４５

AI繪圖 18+/R 實驗室

Q版人物或動物試作

其實，好好看看別人發布的作品，然後仿製，再做出屬於自己的畫作，這個過程真的很有意思! 我今天就看了別人的作品，改一下提示詞(咒語)，玩得很高興。 1.在別人的 Post 裡面找個順眼的圖案... 下圖是舉例的，現在我已經捲不到我之前真正的參考圖案了，所以，有時候還是靠緣分啦。

#AI繪圖 #AI繪圖研究日誌 #TensorArt

歐拉熊的小廢文專欄

【 #週二學創作】1 - 客製化頭像繪製 x2

這個專欄分享了除了PV影片之外，自己學習或創作的其他經歷，包括自製頭像的設計和繪製過程。作者分享了創作的初版草稿、上色過程以及根據意見修改的過程。

#創作 #電腦繪圖 #頭像繪製

真師傅的AI沙龍

#融合 Fusion #手做 VS AI

主題發想 : 傳統與現代的融合。創作理念 : 表達古典元素和現代設計之間的和諧共存之創新藝術。

#融合 #Fusion #古典與現代

Frank Hsu的沙龍

ComfyUI 研究 - 任意圖像放大

前篇測試如何把提示詞生成的圖像細節提高，這篇要測試的工作流是把任意圖像載入後經由放大模型放大，同時測試放大後重繪看看效果如何。

#comfyui #StableDiffusion #AI繪圖

《創作者事業研究室》沙龍

【用風格公式法，讓作品源源不絕產出】

【用風格公式法，讓作品源源不絕產出】

#啟發隨想 #風格公式法 #作品