AI 9月月報-AI爆紅影片風格轉換術大公開!

更新於 2024/09/30閱讀時間約 4 分鐘
ComfyUI — IPAdapter + Controlnet + Animatediff

ComfyUI — IPAdapter + Controlnet + Animatediff


ComfyUI 是一款免費開源且強大的視覺化工作流程工具,使用者能夠直觀地操作並靈活運用生成獨特的 AI 圖像及影片。


一.特色

最近,Runway Gen-3 推出影片轉影片(Video to Video)的功能,能夠穩定地轉換影片風格;不過目前非常多人在使用,生成一個影像往往需要排隊非常久。

我們可以使用 ComfyUI的工作流快速地達到同樣效果並且有更多的參數提供調整,在於尺寸及生成秒數也有更多的調整空間。

有助於專案初期,在有限的時間內節省人力和算圖成本,轉換大量的動態風格。在初期提案中,可以快速具體化接近最終效果的動態畫面。

二.準備流程

  1. 安裝 ComfyUI及安裝 ComfyUI的 Manager
  2. 可以直接使用我的 Workflow 進行測試,不過可能會缺失很多 node,可利用 Manager來一鍵安裝齊全。
  3. 準備素材 (影片*1+物件圖片*1+背景圖片*1)
  4. 操作原始範例,素材使用跳舞影片、花圖片、海邊背景圖
  5. 延伸應用-去背物件的風格轉換,使用元素類型的素材
▲利用 Manager的 Install Missing Custom Nodes來一鍵安裝齊全

▲利用 Manager的 Install Missing Custom Nodes來一鍵安裝齊全



原始範例


▲素材:跳舞影片、花圖片、海邊背景圖

▲素材:跳舞影片、花圖片、海邊背景圖


▲IPAdapter 圖片提示-控制背景圖(海邊)和物件圖(花)

▲IPAdapter 圖片提示-控制背景圖(海邊)和物件圖(花)


▲IPAdapter 權重調整,數值2就算偏高了

▲IPAdapter 權重調整,數值2就算偏高了

IPAdapter 權重越高與參考圖越像,反之權重越低與參考圖越不像。


▲圖片素材會透過mask遮罩跟影片結合

▲圖片素材會透過mask遮罩跟影片結合


▲影片參數調整

▲影片參數調整

這邊有一些可以調整的參數:

• frame_load_cap 是輸出總幀數也就是影片長度,測試時可設短一些如 90。

(如果素材影片很長的話,預設0會跑全部影格,算圖時間會非常久)

• skip_first_frames 是可以跳過前面幀數影格。

• select_every_nth 是可以規律跳過多個幀數。


raw-image
▲Controlnet 控制動作

▲Controlnet 控制動作

Controlnet 強度越強、AI 生成發揮空間越小,所以和參考影片的動作越像。
反之,強度調低、AI 生成發揮空間越大,影片生成動作會更多元。


▲Checkpoint和Lora 是很影響畫面的因素

▲Checkpoint和Lora 是很影響畫面的因素

Checkpoint和 Lora我使用的是 Dreamshaper_8LCM 和 Ghibli_v6 這兩個模型,效果很不錯,大家也可以選擇其他的模型自己做變化。


▲Upscale放大-scale數值是影響畫質的關鍵因素

▲Upscale放大-scale數值是影響畫質的關鍵因素

注意 Scale數值不能太高,不然會爆顯存。
Empty Latent Image 尺寸為512*288放大2倍是1024*576。


動態生成類通常很吃顯存需要特別注意!

▲提供參考,我的電腦顯卡是 RTX 3090,24GB

▲提供參考,我的電腦顯卡是 RTX 3090,24GB


▲Interpolated補間也相當吃記憶體

▲Interpolated補間也相當吃記憶體

若硬體設備不好的話,Interpolated 可以使用 Ctrl+B先關掉避免爆顯存 。


▲左至右分別為 preview(預覽)、upscaled(放大過)、Interpolated(補幀過),主要看第3個 upscaled 的成果即可

▲左至右分別為 preview(預覽)、upscaled(放大過)、Interpolated(補幀過),主要看第3個 upscaled 的成果即可


▲左圖為素材影片,右圖為成果影片

▲左圖為素材影片,右圖為成果影片



延伸應用


想要輸出去背物件做風格轉換且呈現 VFX的效果,因此我們使用元素類型的粒子影片素材及火焰參考圖做嘗試。

在初期提案,可以使用此工作流將簡單素模素材轉換成有貼圖、更精緻且完整度較高的模樣,快速具體化呈現想像中接近最終效果的動態畫面。


▲素材:粒子影片及火焰圖

▲素材:粒子影片及火焰圖


▲上面有提到圖片素材會透過 mask跟影片結合,所以這邊我把關於背景參考圖的設置按Ctrl+B關掉

▲上面有提到圖片素材會透過 mask跟影片結合,所以這邊我把關於背景參考圖的設置按Ctrl+B關掉


▲左圖為素材影片,右圖為成果影片

▲左圖為素材影片,右圖為成果影片



我將這個工作流程(含筆記)放在連結,大家可以嘗試看看。

https://drive.google.com/drive/folders/1IR6OodZ7DuJtyGE1eAP1KxQQPC-0QkYD?usp=sharing


歡迎追蹤我們的社群

IG:https://www.instagram.com/ml_runcat/
Thread:https://www.threads.net/@ml_runcat


歡迎體驗生成

Moonland 酷酷的免費AI生成平台:https://moonland.ai
Moonshot 免費AI生圖機器人:https://ssur.cc/aBP4CtYg

▲Moonshot QRcode

▲Moonshot QRcode




avatar-img
0會員
1內容數
每日來點AI資訊 AI 貓貓 | 最新科技 | 偷臭老闆 | 動畫產業 📩合作邀約:support@moonland.ai ⬇️Moonland-酷酷的免費AI生成平台:https://moonland.ai 🤖Moonshot-Line上的AI繪圖機器人:https://ssur.cc/aBP4CtYg
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
本篇參與的主題活動
安往公司走去,陽光明媚,微風輕拂,是夏季難得的好天氣。僅十分鐘之遙的距離,一步步放大在眼前的大樓場景,愈清晰愈顯壓迫感。 「要是能往後跑走就好了。」這些年來,安不只一次這麼想。那為什麼不這麼做呢?
Carry Kuo 透過文字將自己的職涯經歷與心得化為對他人的啟發。他的作品聚焦於「第一次」的挑戰,特別是那些初入職場、初當主管、初創業的朋友。CK 希望用自己的經歷幫助更多人在職涯迷霧中找到方向。在這次的訪問中,我們將探索他的創作起點、核心理念與未來的創作規劃。 創作的起點:從迷惘中找到力量
上上週的自媒體新手講座結束了,感謝大家來聽,可惜時間有限,沒辦法講更深入,真的對大家有點抱歉。 我知道有同學時間撞到,沒辦法來聽。 所以我做了這份「超懶人包」跟「懶人包」,希望能幫大家節省時間。
哈囉大家好,我是黑貓老師 😎 這篇是我前幾個禮拜講座的懶人包的第二 part。 主要是聊聊剛起步的創作者在流量不多的時候,有什麼變現的機會。
安往公司走去,陽光明媚,微風輕拂,是夏季難得的好天氣。僅十分鐘之遙的距離,一步步放大在眼前的大樓場景,愈清晰愈顯壓迫感。 「要是能往後跑走就好了。」這些年來,安不只一次這麼想。那為什麼不這麼做呢?
Carry Kuo 透過文字將自己的職涯經歷與心得化為對他人的啟發。他的作品聚焦於「第一次」的挑戰,特別是那些初入職場、初當主管、初創業的朋友。CK 希望用自己的經歷幫助更多人在職涯迷霧中找到方向。在這次的訪問中,我們將探索他的創作起點、核心理念與未來的創作規劃。 創作的起點:從迷惘中找到力量
上上週的自媒體新手講座結束了,感謝大家來聽,可惜時間有限,沒辦法講更深入,真的對大家有點抱歉。 我知道有同學時間撞到,沒辦法來聽。 所以我做了這份「超懶人包」跟「懶人包」,希望能幫大家節省時間。
哈囉大家好,我是黑貓老師 😎 這篇是我前幾個禮拜講座的懶人包的第二 part。 主要是聊聊剛起步的創作者在流量不多的時候,有什麼變現的機會。
你可能也想看
Google News 追蹤
Thumbnail
本文探討了複利效應的重要性,並藉由巴菲特的投資理念,說明如何選擇穩定產生正報酬的資產及長期持有的核心理念。透過定期定額的投資方式,不僅能減少情緒影響,還能持續參與全球股市的發展。此外,文中介紹了使用國泰 Cube App 的便利性及低手續費,幫助投資者簡化投資流程,達成長期穩定增長的財務目標。
Thumbnail
網址:https://gadget.chienwen.net/x/text/articlecut 這個網頁裡面有許多小工具, 但感覺現在有很多被 AI 取代掉的東西, 推薦大家可以來用看看~
Thumbnail
文章中,我們介紹了幾款免費的AI影片製作工具,並提供了使用教學和技巧。無論是Lumen5、Pictory、Canva、Kapwing、CapCut還是FlexClip,這些工具都能幫助你高效地實現影片製作目標。此外,我們還介紹了一些其他輔助工具,如AI配音工具和AI繪圖工具,讓您可以更豐富地製作影片
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
這是一個簡單的工作流,可以對輸入的圖片進行3D重建
Thumbnail
前篇測試如何把提示詞生成的圖像細節提高,這篇要測試的工作流是把任意圖像載入後經由放大模型放大,同時測試放大後重繪看看效果如何。
Thumbnail
ComfyUI可以直接將WebUI(A1111算法)生成的圖像拉進介面讀取工作流與提示詞,但是會生成完成不同的圖像,為了讓圖像成果更加接近WebUI(A1111算法)生成的圖像,預設工作流中的部份Nodes需要被替換,且替換完要將一些參數改成A1111。
Thumbnail
這篇是以預設工作流為基礎,加入提示詞去控制畫面,目的是控制生成圖像的主題跟提升品質。
Thumbnail
本文探討了複利效應的重要性,並藉由巴菲特的投資理念,說明如何選擇穩定產生正報酬的資產及長期持有的核心理念。透過定期定額的投資方式,不僅能減少情緒影響,還能持續參與全球股市的發展。此外,文中介紹了使用國泰 Cube App 的便利性及低手續費,幫助投資者簡化投資流程,達成長期穩定增長的財務目標。
Thumbnail
網址:https://gadget.chienwen.net/x/text/articlecut 這個網頁裡面有許多小工具, 但感覺現在有很多被 AI 取代掉的東西, 推薦大家可以來用看看~
Thumbnail
文章中,我們介紹了幾款免費的AI影片製作工具,並提供了使用教學和技巧。無論是Lumen5、Pictory、Canva、Kapwing、CapCut還是FlexClip,這些工具都能幫助你高效地實現影片製作目標。此外,我們還介紹了一些其他輔助工具,如AI配音工具和AI繪圖工具,讓您可以更豐富地製作影片
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
這是一個簡單的工作流,可以對輸入的圖片進行3D重建
Thumbnail
前篇測試如何把提示詞生成的圖像細節提高,這篇要測試的工作流是把任意圖像載入後經由放大模型放大,同時測試放大後重繪看看效果如何。
Thumbnail
ComfyUI可以直接將WebUI(A1111算法)生成的圖像拉進介面讀取工作流與提示詞,但是會生成完成不同的圖像,為了讓圖像成果更加接近WebUI(A1111算法)生成的圖像,預設工作流中的部份Nodes需要被替換,且替換完要將一些參數改成A1111。
Thumbnail
這篇是以預設工作流為基礎,加入提示詞去控制畫面,目的是控制生成圖像的主題跟提升品質。