圖像風格轉換(二)-每次重訓練好麻煩

更新於 發佈於 閱讀時間約 2 分鐘

一.引言

   在第一篇我講到一開始的圖像風格轉換,每產生一張圖片都得重新訓練,這對於使用上難免綁手綁腳,所以理所當然的下一步就是要解決這個問題,看看能不能只要訓練一次,就可以重複使用。

二.方法說明

  在原來的方法中,之所以需要每次都要重複訓練的主要原因就是因為將優化對象從模型本身轉換成輸入圖像,這樣一來模型的功用只有特徵擷取功能,對圖像的優化變成一個一次性計算,於是調整方法便是回歸初衷,來訓練一個模型負責圖像的風格轉換不就能解決了嗎?

  在 Johnson et al. 2016 的  Perceptual Losses for Real-Time Style Transfer and Super-Resolution 中便使用了這樣的架構,其搭建了一個<圖-圖>的網路來生成轉換風格的圖像,後續使用VGG對其進行評估,一樣使用Content Loss及Style Loss去優化整個網路,這樣一來便可以使用一整個資料集的圖像去訓練一個風格。

  Loss方面,除了Content Loss、Style Loss 外,還新增了一個 Total Variation Loss,這個 Loss 主要計算圖像像素在x/y方向梯度的和,可以用來優化圖像的平滑度,減少噪聲的發生。

三.實際演練

  首先可以先去COCO下載一些圖下來(這次實驗載了2014 Train images [83K/13GB]),載完後因為使用 torchvision.datasets.ImageFolder 來載入資料集,所以需要再新建一層資料夾包住所有訓練圖,而後續迭代時拿到的 label 就無視就好,主要網路部分,為下採樣+多層殘差層+上採樣的簡易架構,VGG一樣使用VGG16,實驗程式碼位於我的Github,這次使用以下風格 :

raw-image
raw-image


四.結語

  這次擴展的前一章的程式,額外新建了一個網路來轉換圖像,使用這種方式,可以將風格學習成可重用的網路,但也意味著一個風格就得占用一整個網路的權重,也是挺浪費的,可以嘗試降低網路參數,如減少層數或降低濾波器數量,或是讓我們朝著下一步──將不同風格融入同一個網路內前進,接下來下一篇便會介紹該如何做到一個網路同時學習不同風格。

avatar-img
8會員
21內容數
AI、電腦視覺、圖像處理、AWS等等持續學習時的學習筆記,也包含一些心得,主要是幫助自己學習,若能同時幫助到不小心來到這裡的人,那也是好事一件 : )
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
貓貓學習筆記 的其他內容
  最近遇到一些人想做音訊的合成,我回答他或許可以從圖像風格轉換中找到些靈感,我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何,對於內部訓練邏輯及結構並沒有認真的去了解,現在剛好趁此機會好好的學習一下。
  最近遇到一些人想做音訊的合成,我回答他或許可以從圖像風格轉換中找到些靈感,我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何,對於內部訓練邏輯及結構並沒有認真的去了解,現在剛好趁此機會好好的學習一下。
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
突然發現這個回顧, 可以讓我再一次複習所抄寫的英文, 有時候寫著寫著會錯字很多, 所以有些會塗改很多, 之前沒什麼在用的立可帶, 舊的已經被我用壞了(明明才換新的帶子!!) 後來才又去買了新的立可帶, 也會發現有些故事的主角會重複出現, 雖然不是一樣的勵志文章, 但總覺得好像可以換
Thumbnail
為了打破慣性 開始用左手畫畫 也想著每天還能做一些什麼不同的選擇呢
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
「經驗:第一次接觸的領域,業務內容,用自己的思考去行動,累積經驗。」 「復盤:透過各種角度,利用各種觀點,復盤經驗。」 「概念化:將從一個經驗得到的啟發,應用到其他的場景,形成自己的持論。」 「試行:持論化的東西,在新的場經中實驗看看。」
Thumbnail
再畫一次,再學習一次 失敗,不喜歡沒關係 ✍ 愛我所畫,夢我所愛 圖。文/布恣芽朵
Thumbnail
最近有新的訂閱者加入, 想趁這個機會再分享一次學習心法與建議給第一次練習的讀者、同學們。 如果你本身已經很熟練演算法,那隨機挑題目練習ok,可以測試觀念是否正確,並且驗證寫code的效率與正確程度。 如果是剛畢業或還在學,以前沒有打過程式競賽。 想開始有系統地增強演算法&資料結構的能力
Thumbnail
(點文字可以看到原繪師發布的推文圖片,是參照畫的練習圖) 下午培訓營的老師加開了線上畫圖,線上看別人畫圖一度看到忘記動筆,就好像看哀居短影片裡的人畫圖一樣,很讓人著迷。但別忘了,唯有自己動筆,才會是你的。腦袋、眼睛和手部肌肉才會記得,你畫出每一筆的感覺。 不斷試錯,擦掉重來,反覆練習。 偶爾還
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
Thumbnail
前篇測試如何把提示詞生成的圖像細節提高,這篇要測試的工作流是把任意圖像載入後經由放大模型放大,同時測試放大後重繪看看效果如何。
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
突然發現這個回顧, 可以讓我再一次複習所抄寫的英文, 有時候寫著寫著會錯字很多, 所以有些會塗改很多, 之前沒什麼在用的立可帶, 舊的已經被我用壞了(明明才換新的帶子!!) 後來才又去買了新的立可帶, 也會發現有些故事的主角會重複出現, 雖然不是一樣的勵志文章, 但總覺得好像可以換
Thumbnail
為了打破慣性 開始用左手畫畫 也想著每天還能做一些什麼不同的選擇呢
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
「經驗:第一次接觸的領域,業務內容,用自己的思考去行動,累積經驗。」 「復盤:透過各種角度,利用各種觀點,復盤經驗。」 「概念化:將從一個經驗得到的啟發,應用到其他的場景,形成自己的持論。」 「試行:持論化的東西,在新的場經中實驗看看。」
Thumbnail
再畫一次,再學習一次 失敗,不喜歡沒關係 ✍ 愛我所畫,夢我所愛 圖。文/布恣芽朵
Thumbnail
最近有新的訂閱者加入, 想趁這個機會再分享一次學習心法與建議給第一次練習的讀者、同學們。 如果你本身已經很熟練演算法,那隨機挑題目練習ok,可以測試觀念是否正確,並且驗證寫code的效率與正確程度。 如果是剛畢業或還在學,以前沒有打過程式競賽。 想開始有系統地增強演算法&資料結構的能力
Thumbnail
(點文字可以看到原繪師發布的推文圖片,是參照畫的練習圖) 下午培訓營的老師加開了線上畫圖,線上看別人畫圖一度看到忘記動筆,就好像看哀居短影片裡的人畫圖一樣,很讓人著迷。但別忘了,唯有自己動筆,才會是你的。腦袋、眼睛和手部肌肉才會記得,你畫出每一筆的感覺。 不斷試錯,擦掉重來,反覆練習。 偶爾還
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
Thumbnail
前篇測試如何把提示詞生成的圖像細節提高,這篇要測試的工作流是把任意圖像載入後經由放大模型放大,同時測試放大後重繪看看效果如何。