文字轉語音:使用 Voice Clone Multilingual 生成知名人物聲音

文字轉語音:使用 Voice Clone Multilingual 生成知名人物聲音

更新於 發佈於 閱讀時間約 2 分鐘

文字轉語音 TTS 技術能將文本內容轉換為朗讀語音,若想以知名人物的聲音來生成語音也變得容易。Voice Clone Multilingual 是一個聲音克隆 TTS 工具,用戶可以上傳聲音範本(語音檔),由 AI 分析聲音特徵並進行克隆,這意味著任何人物的聲音都可以用來生成朗讀語音,無論在教育、娛樂或其他場景都很實用。

raw-image


Voice Clone Multilingual 託管於 Hugging Face 空間,支援十多種語言,包括英文、中文、日語、德語、俄文、西班牙和葡萄牙等,只需輸入文本內容和上傳音檔作為範本,即可生成朗讀語音,而且說話口氣與聲音特質會與範本相似。

網址:https://huggingface.co/spaces/Nymbo/Voice-Clone-Multilingual

原文連結:https://www.xiaoyao.tw/2024/11/voice-clone-tts.html

訪問網頁即可使用,無須註冊,生成語音後可免費下載 WAV 音訊檔案。要提醒一點,由於轉換過程需要克隆聲音,處理時間會比普通 TTS 工具更長,此外,若遇到多人同時使用,可能需要排隊等候更多時間,

使用說明

打開 Hugging Face 平台上的 Voice Clone Multilingual 頁面,在 Text 方框輸入文本內容,然後上傳音訊檔案作為聲音範本,也能使用麥克風錄製語音。

raw-image


接著在 language 選擇要朗讀的文本語言,點擊「Submit」提交轉換處理。

raw-image
avatar-img
逍遙資訊
13會員
65內容數
「逍遙資訊|方格子」為「逍遙の窩」第二站點,文章內容皆來自 xiaoyao.tw 網站,將原文縮減為重點摘要,涵蓋桌面軟體、手機App、網路服務、AI 應用等主題,立即追蹤掌握資訊!
留言
avatar-img
留言分享你的想法!
逍遙資訊 的其他內容
ClassicGameZone(Retro Games)是一個免費的復古遊戲平臺,收錄大量紅白機、超級任天堂、街機等經典遊戲,無需下載,即可在現代瀏覽器上遊玩。網站支援繁體中文,介面簡潔直覺,所有遊戲皆為合法授權。
BlinkShot 是一個免費且開源的線上 AI 繪圖工具,基於 Together AI 的 Flux 模型,用戶可以通過輸入文字描述(英文提示詞)即時生成圖像。該工具無需註冊,介面簡潔,並且具有快速反應能力,隨時偵測文本變化。無次數限制,使用極其方便,特別適合對 AI 繪圖有需求的使用者。
自從 OpenAI 推出 ChatGPT,生成式人工智慧技術引起廣泛關注。AnyChat 是一個由 Ahsen Khaliq 開發的多模型聊天平臺,整合了多種大型語言模型,如 ChatGPT、Gemini、Claude 等,使用戶能在單一介面上進行靈活的 AI 聊天體驗。
ClassicGameZone(Retro Games)是一個免費的復古遊戲平臺,收錄大量紅白機、超級任天堂、街機等經典遊戲,無需下載,即可在現代瀏覽器上遊玩。網站支援繁體中文,介面簡潔直覺,所有遊戲皆為合法授權。
BlinkShot 是一個免費且開源的線上 AI 繪圖工具,基於 Together AI 的 Flux 模型,用戶可以通過輸入文字描述(英文提示詞)即時生成圖像。該工具無需註冊,介面簡潔,並且具有快速反應能力,隨時偵測文本變化。無次數限制,使用極其方便,特別適合對 AI 繪圖有需求的使用者。
自從 OpenAI 推出 ChatGPT,生成式人工智慧技術引起廣泛關注。AnyChat 是一個由 Ahsen Khaliq 開發的多模型聊天平臺,整合了多種大型語言模型,如 ChatGPT、Gemini、Claude 等,使用戶能在單一介面上進行靈活的 AI 聊天體驗。