先上個一標準範例:
但我當然不會規規矩矩的這樣子用,又輪到我們的川普上場了:
(川普:幹又是我!)
我想這些軟體作者應該會想殺了我,大家在介紹軟體時都是放一些乾淨漂亮的標準範例,結果我都放一些惡搞的極限使用,一用下去馬上爛給你看。
另外,我怕黃國昌來告我,附上使用素材來源:
黃國昌會唱甩蔥歌的原因是,他答應直播觀眾若有達成特定里程碑的話就會唱一首甩蔥歌來回饋觀眾(自我體罰?)。
除了甩蔥歌之外再加上一些黃國昌質詢時的網路片段,咆哮獸也是黃國昌的外號之一,因為他的質詢特色就是非常的兇悍。
SadTalker也是一個stable diffusion webUI下的外掛,主要功能是將單張的靜態圖像轉成配合口白聲音檔的對嘴動畫,其實已經有許多付費網站提供類似的功能,使用SadTalker的差別在於可單機執行而且免費,但若論畫面精緻度的話,我覺得還是收費網站好一點。
這類收費網站已經有很多,例如比較早期的知名網站是:d-id
,近期也有很多功能類似的網站出現,例如Artflow,Artflow不只是單純的生成對嘴動畫,還能微調畫面結構與運鏡等等。
總而言之,SadTalker算是一個簡單且免費的小工具,可以玩玩,但若真要拿來工作的話還是稍嫌不足,其精細度不如那些付費網站。
另外,就算是使用付費服務產出來的對嘴動畫,多少還是有些不自然的感覺,有種難以言喻的機械感,這就是目前AI的侷限了,相信未來還會持續進步的。
可以參考民視推出的AI新聞,就算是民視特地用來展示表演的這位AI主播,也仍然有著生硬的機械感:
SadTalker的安裝與一般的stable diffusion webUI外掛安裝方式相同,直接在extensions頁籤下搜尋SadTalker即可。
接著到這個網址下載必要的模型檔:
https://drive.google.com/file/d/1gwWh45pF7aelNP_P78uDJL8Sycep-K7j/view?usp=sharing
下載後是一個zip檔,解壓縮後將這些檔案放到stable-diffusion-webui資料夾\extensions\SadTalker\checkpoints
這是個簡單步驟卻害我卡了一下,因為目前大多數的外掛都已經做到非常懶人的全自動安裝了,我沒預料到還要自己動手下載模型,在那邊瞎按了好幾下還以為是壞了。
在預設情況下,SadTalker僅支援wav音效檔,若你需要使用到其它聲音檔,例如mp3,那就要使用到ffmpeg插件。
先到下方網址下載ffmpeg檔案:
https://github.com/BtbN/FFmpeg-Builds/releases
下載會後會是一個zip檔,將其解壓縮,並記住檔案路徑。
接著將此檔案路徑設置到windows的PATH中,如果是windows 10的話,設置步驟如下:
整套都安裝完成後,在stable diffusion webUI的介面中,會出現一個SadTalker的獨立頁籤。
使用方式很簡單,在左側欄位中,分別傳入一個人臉圖像以及一個聲音檔,然後在右側選擇想要的解析度或設定項,點擊Generate就會產出一個影片檔了。
結束,今天一樣只是介紹一個小玩具。