圖像風格轉換(二)-每次重訓練好麻煩

閱讀時間約 2 分鐘

一.引言

   在第一篇我講到一開始的圖像風格轉換,每產生一張圖片都得重新訓練,這對於使用上難免綁手綁腳,所以理所當然的下一步就是要解決這個問題,看看能不能只要訓練一次,就可以重複使用。

二.方法說明

  在原來的方法中,之所以需要每次都要重複訓練的主要原因就是因為將優化對象從模型本身轉換成輸入圖像,這樣一來模型的功用只有特徵擷取功能,對圖像的優化變成一個一次性計算,於是調整方法便是回歸初衷,來訓練一個模型負責圖像的風格轉換不就能解決了嗎?

  在 Johnson et al. 2016 的  Perceptual Losses for Real-Time Style Transfer and Super-Resolution 中便使用了這樣的架構,其搭建了一個<圖-圖>的網路來生成轉換風格的圖像,後續使用VGG對其進行評估,一樣使用Content Loss及Style Loss去優化整個網路,這樣一來便可以使用一整個資料集的圖像去訓練一個風格。

  Loss方面,除了Content Loss、Style Loss 外,還新增了一個 Total Variation Loss,這個 Loss 主要計算圖像像素在x/y方向梯度的和,可以用來優化圖像的平滑度,減少噪聲的發生。

三.實際演練

  首先可以先去COCO下載一些圖下來(這次實驗載了2014 Train images [83K/13GB]),載完後因為使用 torchvision.datasets.ImageFolder 來載入資料集,所以需要再新建一層資料夾包住所有訓練圖,而後續迭代時拿到的 label 就無視就好,主要網路部分,為下採樣+多層殘差層+上採樣的簡易架構,VGG一樣使用VGG16,實驗程式碼位於我的Github,這次使用以下風格 :

raw-image
raw-image


四.結語

  這次擴展的前一章的程式,額外新建了一個網路來轉換圖像,使用這種方式,可以將風格學習成可重用的網路,但也意味著一個風格就得占用一整個網路的權重,也是挺浪費的,可以嘗試降低網路參數,如減少層數或降低濾波器數量,或是讓我們朝著下一步──將不同風格融入同一個網路內前進,接下來下一篇便會介紹該如何做到一個網路同時學習不同風格。

8會員
21內容數
AI、電腦視覺、圖像處理、AWS等等持續學習時的學習筆記,也包含一些心得,主要是幫助自己學習,若能同時幫助到不小心來到這裡的人,那也是好事一件 : )
留言0
查看全部
發表第一個留言支持創作者!
貓貓學習筆記 的其他內容
  最近遇到一些人想做音訊的合成,我回答他或許可以從圖像風格轉換中找到些靈感,我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何,對於內部訓練邏輯及結構並沒有認真的去了解,現在剛好趁此機會好好的學習一下。
  最近遇到一些人想做音訊的合成,我回答他或許可以從圖像風格轉換中找到些靈感,我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何,對於內部訓練邏輯及結構並沒有認真的去了解,現在剛好趁此機會好好的學習一下。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
Freepik除了提供素材下載外,還可以線上生成AI圖片, 圖片生成工具名為「AI Image Generator」,只需要輸入文字就能快速生成圖片,每天能免費生成 20 張圖片,還可依照自己的喜好設定不同風格、燈光、畫面尺寸等參數。
Thumbnail
Tenge AI是一款免費的AI圖像生成器,支持中文和英文提示詞或圖像上傳生成。它提供了19種風格,並可以用於商業用途。
Thumbnail
可能包含敏感內容
這邊紀錄使用Bing images create 生成原圖並利用Tensor art
Thumbnail
AI 繪圖提詞咒語(prompts)詠唱,如何呈現/表現一張圖像的風格,同時,還能夠學英文!
Thumbnail
幾乎可以說是跟stable diffusion一體同命的ControlNet的XL版本總算是上線了,算是為SDXL補上最關鍵一塊地圖,以下快速的來瀏覽一下它的安裝方式與功能吧。
Thumbnail
柔軟具伸縮性的運動服裝,緩緩沿著身型塑出身體曲線,香奈爾按此概念設計服裝。
Thumbnail
Midjourney生成式AI利用強大技術,讓設計師輕鬆創造多樣風格的Line貼圖,充滿獨特魅力。不僅提高設計效率,也激發無限創意,帶來全新創作體驗,革新平面設計。這篇文章詳解Midjourney設計步驟與生成設計成果!
Thumbnail
本文介紹了如何使用Midjourney平台生成驚奇隊長圖像。用戶可以根據喜好和需求,設定風格、尺寸和細節,生成獨特的驚奇隊長圖像。文章提供了不同風格和場景的指令範例,並分析了生成圖像的質量、細節和潛在限制。此外,生成的圖像可作為創意靈感,應用於個人或商業項目。
Thumbnail
An Chen,一個用形狀畫畫的插畫家。喜歡用具幾何機械感的手法繪製花草,在有機物、無機物中無止盡的實驗著。2019年畢業於劍橋藝術學院兒童繪本系,作品多出現於報紙雜誌編輯領域,國內外客戶比較有名的有Apple、Gucci、The New Yorker、紐約時報、華爾街郵報、週刊編集、台灣設計展等。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
Freepik除了提供素材下載外,還可以線上生成AI圖片, 圖片生成工具名為「AI Image Generator」,只需要輸入文字就能快速生成圖片,每天能免費生成 20 張圖片,還可依照自己的喜好設定不同風格、燈光、畫面尺寸等參數。
Thumbnail
Tenge AI是一款免費的AI圖像生成器,支持中文和英文提示詞或圖像上傳生成。它提供了19種風格,並可以用於商業用途。
Thumbnail
可能包含敏感內容
這邊紀錄使用Bing images create 生成原圖並利用Tensor art
Thumbnail
AI 繪圖提詞咒語(prompts)詠唱,如何呈現/表現一張圖像的風格,同時,還能夠學英文!
Thumbnail
幾乎可以說是跟stable diffusion一體同命的ControlNet的XL版本總算是上線了,算是為SDXL補上最關鍵一塊地圖,以下快速的來瀏覽一下它的安裝方式與功能吧。
Thumbnail
柔軟具伸縮性的運動服裝,緩緩沿著身型塑出身體曲線,香奈爾按此概念設計服裝。
Thumbnail
Midjourney生成式AI利用強大技術,讓設計師輕鬆創造多樣風格的Line貼圖,充滿獨特魅力。不僅提高設計效率,也激發無限創意,帶來全新創作體驗,革新平面設計。這篇文章詳解Midjourney設計步驟與生成設計成果!
Thumbnail
本文介紹了如何使用Midjourney平台生成驚奇隊長圖像。用戶可以根據喜好和需求,設定風格、尺寸和細節,生成獨特的驚奇隊長圖像。文章提供了不同風格和場景的指令範例,並分析了生成圖像的質量、細節和潛在限制。此外,生成的圖像可作為創意靈感,應用於個人或商業項目。
Thumbnail
An Chen,一個用形狀畫畫的插畫家。喜歡用具幾何機械感的手法繪製花草,在有機物、無機物中無止盡的實驗著。2019年畢業於劍橋藝術學院兒童繪本系,作品多出現於報紙雜誌編輯領域,國內外客戶比較有名的有Apple、Gucci、The New Yorker、紐約時報、華爾街郵報、週刊編集、台灣設計展等。