付費限定

製作專屬數字人教學

閱讀時間約 2 分鐘

需要用到的工具:

1,elevenlabs(聲音處理)

2,heygen(數字人製作)

開啟網址: ElevenLabs - Generative AI Text to Speech & Voice Cloning並註冊帳戶

raw-image
raw-image

Ps:這一步目的是為了方便聲音的處理

2,將錄製好的音頻,上傳至voicelab語音實驗室,用於產生自己的音訊。

raw-image

將生成的音訊設定一個名字,方便之後操作(例如我設定的名字是sam)

raw-image

3,點選speech synthesis語音合成,在settings一欄分別選擇自己設定的聲音,聲音的特定參數(例如音量的大小)。選擇eleven english v1(使我們的聲音更真實)。

在text一欄中,輸入自己想要朗讀的文字內容ps:如圖所示

raw-image

4,點選gengrate,產生後會在頁面顯示產生結果。點擊下載,將產生的聲音儲存。

raw-image

5,製作數字人,請造訪:www.heygen.com並開設帳戶

raw-image

6,點選upload talkingpgoto ,上傳自己的頭像

ps:頭像背景一定要乾淨

raw-image

7,點選自己上傳的頭像

raw-image

8,點選audio script,之後點選choose a file or drag it here,將剛才儲存的音訊檔案進行上傳或拖曳到此處

raw-image

9,點擊submit將產生的影片進行儲存,現在你的專屬數位人就製作完成了

raw-image

使用建議:

(1)如需要不說話的動圖視頻,點擊計時器按鈕進行操作(每個計時器為0.5s)依據自己需求進行添加

raw-image

(2)為什麼不適用DID?

因為did對名人有保護,所以選擇使用heygen,如果不產生名人的數位人DID也是一個好的選擇。

(3)兩個工具都需要收費,但是都有免費版可以提供試用。可以根據自身情況選擇是否需要付費。

(4)照片的選擇盡量背景乾淨,正面人像。否則會影響效果。

(5)elevenlabs(聲音處理)是一款非常好的音頻合成工作,我們在上傳音頻時,一定要選擇無雜音的音頻,但目前不支援中文輸出。











創作者正在準備中
請加入 男子漢聊AI的沙龍 了解最新動態!
avatar-img
27會員
186內容數
「秒懂AI提問指令」是您AI學習的社群首選,擁有專業的ChatGPT、MidJourney及stable diffusion知識分享。這裡不僅是學習AI內容的最佳平台,更是實戰與資源的寶庫。讓人工智能成為你的效率神器,助您深入了解AI各種面向。更重要的是,我們的社群中聚集了大量AI極客,讓您有機會與同好一同交流、學習。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
男子漢聊AI的沙龍 的其他內容
1,確定冥想目標 Prompt:你能幫我澄清冥想練習的主要目標,比如緩解壓力、增加注意力、情緒治療等嗎? 2,探索不同的冥想技巧 Prompt:有哪些不同的冥想技巧可能對具有我特定目標和經驗水準的人有益?
1. 時間管理 “提供8小時工作日的詳細時間表,優化能量水準和任務多樣性,以確保最大的生產力。”  2. 任務優先順序  “列出確定任務優先順序時要考慮的關鍵因素,並創建一個決策矩陣,根據緊急性和重要性對任務進行排名。”
偷懶的時候可以使用: 但是還是建議系統學習Midjourney,來針對你的更具體的場景和需求完成AI繪畫任務。 直接複製一下代碼到你的chatgpt:  ----------------
1. 選擇您的頭像或建立一個。 →造訪:http:// heygen.com 並開立帳戶。 →從120+頭像中選擇您最喜歡的頭像。 →或者您可以建立自己的頭像。 2. 新增文字腳本。 →超過40種語言和300 +語音可用。 →新增文字輸入並檢查音訊。 3. 提交您的影片以進行最終輸出。
為什麼ChatGPT 提示對於保留客戶至關重要? ChatGPT 保留客戶提示是重要的工具,對企業和個人都有巨大的價值。對企業來說,這些提示有可能顯著影響他們的利潤、效率和顧客滿意度指標。根據《富比士》最近的一項研究,70% 優先考慮保留客戶的公司比不優先考慮的公司收入更高。
1:職業教練 「充當職業教練,並提出提高[主題]工作績效的策略。 2:生產力顧問 “擔任生產力顧問,並建議提高[主題]工作效率的工具。” 3:溝通 “充當溝通專家,起草電子郵件或訊息,以改善與[主題]相關的工作中的溝通。”
1,確定冥想目標 Prompt:你能幫我澄清冥想練習的主要目標,比如緩解壓力、增加注意力、情緒治療等嗎? 2,探索不同的冥想技巧 Prompt:有哪些不同的冥想技巧可能對具有我特定目標和經驗水準的人有益?
1. 時間管理 “提供8小時工作日的詳細時間表,優化能量水準和任務多樣性,以確保最大的生產力。”  2. 任務優先順序  “列出確定任務優先順序時要考慮的關鍵因素,並創建一個決策矩陣,根據緊急性和重要性對任務進行排名。”
偷懶的時候可以使用: 但是還是建議系統學習Midjourney,來針對你的更具體的場景和需求完成AI繪畫任務。 直接複製一下代碼到你的chatgpt:  ----------------
1. 選擇您的頭像或建立一個。 →造訪:http:// heygen.com 並開立帳戶。 →從120+頭像中選擇您最喜歡的頭像。 →或者您可以建立自己的頭像。 2. 新增文字腳本。 →超過40種語言和300 +語音可用。 →新增文字輸入並檢查音訊。 3. 提交您的影片以進行最終輸出。
為什麼ChatGPT 提示對於保留客戶至關重要? ChatGPT 保留客戶提示是重要的工具,對企業和個人都有巨大的價值。對企業來說,這些提示有可能顯著影響他們的利潤、效率和顧客滿意度指標。根據《富比士》最近的一項研究,70% 優先考慮保留客戶的公司比不優先考慮的公司收入更高。
1:職業教練 「充當職業教練,並提出提高[主題]工作績效的策略。 2:生產力顧問 “擔任生產力顧問,並建議提高[主題]工作效率的工具。” 3:溝通 “充當溝通專家,起草電子郵件或訊息,以改善與[主題]相關的工作中的溝通。”
你可能也想看
Google News 追蹤
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
PopPop AI 推出的免費線上音效產生器可以將文字轉換為各種聲音,包括自然、人類、樂器、環境和特殊效果等。支援多種語言,使用者可以輸入中文描述創建音效,並可直接播放聆聽和下載音訊。
Thumbnail
使用AI寫歌確實是一個新興的創作方法。 以下是使用AI寫歌的基本步驟和所需能力: 步驟: 1. 選擇AI工具:挑選適合的AI歌曲創作工具或平台。 2. 輸入初始參數:設定風格、情感、主題等基本參數。 3. 生成初稿:讓AI生成歌曲的初始版本,包括旋律和歌詞。 4. 審核和編輯:檢查AI生
Thumbnail
今天我要跟大家聊聊 GPT-SoVITS 的用途及其功能。 這個開源的聲音克隆專案,融合了業內頂尖的語音合成工具——GPT (Generative Pre-trained Transformer)模型,和SoVITS(Speech-to-Video Voice Transformation Sys
Thumbnail
  我們在語音初探篇提到TTS的流程可以分成三個部分 :輸入前處理、預測音訊特徵、語音重建,其中輸入前處理的部分上兩篇已經處理完,在進入預測音訊特徵前,讓我們先來理解最後的語音重建部分。
Thumbnail
「人工智障計畫」也執行了好一段時間了,關於這個專案中文字轉語音的方案,在之前的筆記中也有稍微提到,為了達成能自訂聲線,並且能完全離線運作兩個條件,我已經做過了不少嘗試。
Thumbnail
使用人工智慧生成模型可以創作各種媒體內容,MusicGen Web 是一個基於瀏覽器的免費 AI 音樂生成工具,訪問網頁,輸入文字描述即可創作獨特的音樂,包括流行、爵士、電子、古典等多種風格。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
我測試的文字轉語音工具,我可以導入4000-5000(甚至高達10,000)個單詞來生成我的音頻檔案。 https://www.text-to-speech.online/ https://ttsmaker.com/ 其他工具但對字符數有一些限制: https://ttsfree.
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
PopPop AI 推出的免費線上音效產生器可以將文字轉換為各種聲音,包括自然、人類、樂器、環境和特殊效果等。支援多種語言,使用者可以輸入中文描述創建音效,並可直接播放聆聽和下載音訊。
Thumbnail
使用AI寫歌確實是一個新興的創作方法。 以下是使用AI寫歌的基本步驟和所需能力: 步驟: 1. 選擇AI工具:挑選適合的AI歌曲創作工具或平台。 2. 輸入初始參數:設定風格、情感、主題等基本參數。 3. 生成初稿:讓AI生成歌曲的初始版本,包括旋律和歌詞。 4. 審核和編輯:檢查AI生
Thumbnail
今天我要跟大家聊聊 GPT-SoVITS 的用途及其功能。 這個開源的聲音克隆專案,融合了業內頂尖的語音合成工具——GPT (Generative Pre-trained Transformer)模型,和SoVITS(Speech-to-Video Voice Transformation Sys
Thumbnail
  我們在語音初探篇提到TTS的流程可以分成三個部分 :輸入前處理、預測音訊特徵、語音重建,其中輸入前處理的部分上兩篇已經處理完,在進入預測音訊特徵前,讓我們先來理解最後的語音重建部分。
Thumbnail
「人工智障計畫」也執行了好一段時間了,關於這個專案中文字轉語音的方案,在之前的筆記中也有稍微提到,為了達成能自訂聲線,並且能完全離線運作兩個條件,我已經做過了不少嘗試。
Thumbnail
使用人工智慧生成模型可以創作各種媒體內容,MusicGen Web 是一個基於瀏覽器的免費 AI 音樂生成工具,訪問網頁,輸入文字描述即可創作獨特的音樂,包括流行、爵士、電子、古典等多種風格。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
我測試的文字轉語音工具,我可以導入4000-5000(甚至高達10,000)個單詞來生成我的音頻檔案。 https://www.text-to-speech.online/ https://ttsmaker.com/ 其他工具但對字符數有一些限制: https://ttsfree.