需要用到的工具:
1,elevenlabs(聲音處理)
2,heygen(數字人製作)
開啟網址: ElevenLabs - Generative AI Text to Speech & Voice Cloning並註冊帳戶
Ps:這一步目的是為了方便聲音的處理
2,將錄製好的音頻,上傳至voicelab語音實驗室,用於產生自己的音訊。
將生成的音訊設定一個名字,方便之後操作(例如我設定的名字是sam)
3,點選speech synthesis語音合成,在settings一欄分別選擇自己設定的聲音,聲音的特定參數(例如音量的大小)。選擇eleven english v1(使我們的聲音更真實)。
在text一欄中,輸入自己想要朗讀的文字內容ps:如圖所示
4,點選gengrate,產生後會在頁面顯示產生結果。點擊下載,將產生的聲音儲存。
5,製作數字人,請造訪:www.heygen.com並開設帳戶
6,點選upload talkingpgoto ,上傳自己的頭像
ps:頭像背景一定要乾淨
7,點選自己上傳的頭像
8,點選audio script,之後點選choose a file or drag it here,將剛才儲存的音訊檔案進行上傳或拖曳到此處
9,點擊submit將產生的影片進行儲存,現在你的專屬數位人就製作完成了
使用建議:
(1)如需要不說話的動圖視頻,點擊計時器按鈕進行操作(每個計時器為0.5s)依據自己需求進行添加
(2)為什麼不適用DID?
因為did對名人有保護,所以選擇使用heygen,如果不產生名人的數位人DID也是一個好的選擇。
(3)兩個工具都需要收費,但是都有免費版可以提供試用。可以根據自身情況選擇是否需要付費。
(4)照片的選擇盡量背景乾淨,正面人像。否則會影響效果。
(5)elevenlabs(聲音處理)是一款非常好的音頻合成工作,我們在上傳音頻時,一定要選擇無雜音的音頻,但目前不支援中文輸出。