2024-02-29|閱讀時間 ‧ 約 25 分鐘

ComfyUI 研究 - 生成影片


SVD - Stable Video Diffusion

SVD是Stable Diffusion官方Stability AI在2023年11月21日釋出的影片生成模型,官方發布的新聞連結如下:

https://stability.ai/news/stable-video-diffusion-open-ai-video-model

撰文當下是2024年2月29日,才三個多月的時間,AI生成影片已經進入下一個階段,除了Open AI在2024年2月16日發表了驚豔四方的Sora外,2月28日阿里巴巴更發表了一張圖片即可生成對嘴影片的EMO(Emote Portrait Alive)模型。

感覺AI生成的腳步不只是停不下來,甚至還不斷地加速中。

如果看到這邊還有興趣跟我一起研究的人,請繼續往下閱讀。


SVD 官方工作流


上圖的工作流是ComfyUI官方提供的svd模型工作流,組成的節點如下:

  • Load Image
  • Image Only Checkpoint Loader (img2vid model)
  • VideoLinearCFGGuidance
  • SVD_img2vid_Conditioning
  • KSampler
  • VAE Decode
  • SaveAnimatedWEBP

這個工作流的功用是圖生影片,使用官方提供的svd.safetensors模型可以生成最多14幀的影片,使用svd_xt.safetensors或svd_xt_1_1.safetensors模型則可以生成最多25幀的影片。

如果將Load Image改成文生圖工作流再輸入到圖生影片的工作流中,則可以實現文生影片的效果。


節點參數簡介

在下圖這個SVD專用的節點中,motion_bucket_id可以控制畫面中動的物件數量,值愈大動得愈多,但會產生模糊,augmentation_level則是與原圖的差異,值愈大愈不像原圖。


另外,下圖VideoLinearCFGGuidance這個節點可以動態調整CFG的值,將min_cfg設定比KSampler的CFG值低,就可以在生成過程中調整CFG值,生成的圖像會比較溫和。



SVD模型擅長處理風景圖片,在處理非風景的圖片時需要其他節點輔助提昇品質。

SVD的優點是用一張圖片就可以生成影片且品質不錯,缺點是影片的效果是由模型決定,


AnimateDiff

AnimateDiff 早於 SVD 發表,因此網路上有很多基於AnimateDiff的工作流可以使用,生成的影像品質跟效果皆可以控制,還可以套用Controlnet跟Lora,或是搭配SVD使用。


基本工作流

下圖是套用AnimateDiff的基本工作流。


其實這個工作流類似套用Lora時使用的工作流,只要將AnimaterDiff Loader這個節點插入到大模型跟KSampler中間,就可以使用AnimateDiff,只要在Empty Latent Image這個節點設定batch_size的數值,就可以設定總共要生成多少圖片。

工作流的最右側節點我原本都是使用Preview Image,在生成影片時需要用自動結合圖片的節點如Video Combine。



在Video Combine節點設定frame_rate可以決定每秒幀數,例如生成了16張圖,使用8幀/秒則可將16張圖結合成2秒的影片。

這個工作流經過測試容易佔用太大的顯示卡記憶體而跑不動。


進階工作流

下圖是用AnimateDiff Evolved提供的節點搭建的工作流。

這個工作流與基本工作流的差異在於可以一次生成更多幀數而不會佔用太多顯示卡記憶體。

另外加入了AnimateDiff提供的動態LoRA,可以選擇預設的一些鏡頭效果如平移、旋轉等。

這個工作流的後端就是一般的文生圖工作流。


延伸討論

下圖是我從https://openart.ai/home這個網站下載的一個工作流。

這個工作流是用SVD生成影片,再用AnimateDiff重新製作一次動畫,另外經過放大及ControlNet處理提升畫質。

雖然作者已經分好群組也使用了很多節點讓工作流看起來沒那麼混亂,但是要使用這個工作流除了要把缺失的節點都安裝好外,也要知道調整那些參數及在什麼節點使用什麼類型的模型。

另外網路上也有將抖音真人跳舞影片轉成其他風格的跳舞影片的工作流,下載後會發現使用了各種千奇百怪的節點,即使透過Manger安裝了許多節點,也還有缺失的節點無法執行。

當我剛開始使用ComfyUI時遇過上述的問題許多次,做了很多功課跟嘗試才慢慢地知道如何找出缺失的節點並安裝,或是用其他節點取而代之。

本篇只是做為AI生成影片的一個引子,之後我會分享更多工作流跟新的AI資訊。


敬請期待。




分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.