文字轉語音:使用 Voice Clone Multilingual 生成知名人物聲音

更新於 2024/11/27閱讀時間約 2 分鐘

文字轉語音 TTS 技術能將文本內容轉換為朗讀語音,若想以知名人物的聲音來生成語音也變得容易。Voice Clone Multilingual 是一個聲音克隆 TTS 工具,用戶可以上傳聲音範本(語音檔),由 AI 分析聲音特徵並進行克隆,這意味著任何人物的聲音都可以用來生成朗讀語音,無論在教育、娛樂或其他場景都很實用。

raw-image


Voice Clone Multilingual 託管於 Hugging Face 空間,支援十多種語言,包括英文、中文、日語、德語、俄文、西班牙和葡萄牙等,只需輸入文本內容和上傳音檔作為範本,即可生成朗讀語音,而且說話口氣與聲音特質會與範本相似。

網址:https://huggingface.co/spaces/Nymbo/Voice-Clone-Multilingual

原文連結:https://www.xiaoyao.tw/2024/11/voice-clone-tts.html

訪問網頁即可使用,無須註冊,生成語音後可免費下載 WAV 音訊檔案。要提醒一點,由於轉換過程需要克隆聲音,處理時間會比普通 TTS 工具更長,此外,若遇到多人同時使用,可能需要排隊等候更多時間,

使用說明

打開 Hugging Face 平台上的 Voice Clone Multilingual 頁面,在 Text 方框輸入文本內容,然後上傳音訊檔案作為聲音範本,也能使用麥克風錄製語音。

raw-image


接著在 language 選擇要朗讀的文本語言,點擊「Submit」提交轉換處理。

raw-image
avatar-img
7會員
63內容數
「逍遙資訊|方格子」為「逍遙の窩」第二站點,文章內容皆來自 xiaoyao.tw 網站,將原文縮減為重點摘要,涵蓋桌面軟體、手機App、網路服務、AI 應用等主題,立即追蹤掌握資訊!
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
逍遙資訊 的其他內容
自從 OpenAI 推出 ChatGPT,生成式人工智慧技術引起廣泛關注。AnyChat 是一個由 Ahsen Khaliq 開發的多模型聊天平臺,整合了多種大型語言模型,如 ChatGPT、Gemini、Claude 等,使用戶能在單一介面上進行靈活的 AI 聊天體驗。
YoutubeDownloader 是一款免費且開源的 YT 影音下載器,適用於 Windows、MacOS 和 Linux 系統,輸入 YT 影片連結即可下載影音檔案,支援提取播放清單和批量下載。
Stirling PDF 是一款強大的免費開源 PDF 處理工具,提供多達 50 種功能,包括拆分、合併、轉換、重新排列、添加圖像及壓縮等。無需註冊、完全免費,用戶可以不受限制地高效處理各種 PDF 問題,甚至超越某些付費服務。
MediaGo 是一款免費、開源的串流影片下載器,內置瀏覽器可以輕鬆檢測網頁中的 M3U8 連結,只需載入影片頁面即可開始下載。
SeekAll 是一款免費的 Chrome 擴充功能,提供更為快速的搜尋方式,能夠一次搜尋多個網站,輕鬆查看不同平台的搜尋結果。
PopPop AI 線上 AI 歌曲翻唱生成器,提供 50 多種語音。支援多種音訊和影片格式,選擇聲音並上傳檔案,或提交社群媒體連結自動抓取檔案,不需註冊,輕鬆下載翻唱的歌曲。
自從 OpenAI 推出 ChatGPT,生成式人工智慧技術引起廣泛關注。AnyChat 是一個由 Ahsen Khaliq 開發的多模型聊天平臺,整合了多種大型語言模型,如 ChatGPT、Gemini、Claude 等,使用戶能在單一介面上進行靈活的 AI 聊天體驗。
YoutubeDownloader 是一款免費且開源的 YT 影音下載器,適用於 Windows、MacOS 和 Linux 系統,輸入 YT 影片連結即可下載影音檔案,支援提取播放清單和批量下載。
Stirling PDF 是一款強大的免費開源 PDF 處理工具,提供多達 50 種功能,包括拆分、合併、轉換、重新排列、添加圖像及壓縮等。無需註冊、完全免費,用戶可以不受限制地高效處理各種 PDF 問題,甚至超越某些付費服務。
MediaGo 是一款免費、開源的串流影片下載器,內置瀏覽器可以輕鬆檢測網頁中的 M3U8 連結,只需載入影片頁面即可開始下載。
SeekAll 是一款免費的 Chrome 擴充功能,提供更為快速的搜尋方式,能夠一次搜尋多個網站,輕鬆查看不同平台的搜尋結果。
PopPop AI 線上 AI 歌曲翻唱生成器,提供 50 多種語音。支援多種音訊和影片格式,選擇聲音並上傳檔案,或提交社群媒體連結自動抓取檔案,不需註冊,輕鬆下載翻唱的歌曲。
你可能也想看
Google News 追蹤
Thumbnail
本文探討了複利效應的重要性,並藉由巴菲特的投資理念,說明如何選擇穩定產生正報酬的資產及長期持有的核心理念。透過定期定額的投資方式,不僅能減少情緒影響,還能持續參與全球股市的發展。此外,文中介紹了使用國泰 Cube App 的便利性及低手續費,幫助投資者簡化投資流程,達成長期穩定增長的財務目標。
Thumbnail
Free Online AI Vocal Remover & Isolator 是一個線上音訊分離工具,運用 AI 技術精準辨識人聲和樂器並自動消除噪音,輸出高品質清晰音訊。上傳音樂或影片即可獲得人聲和伴奏音樂,支援抓取社群影音檔案,提交連結可以免費下載高品質MP3。
Thumbnail
沉浸式翻譯是一款多功能的瀏覽器插件和手機APP,專門為僅懂中文的使用者打造。它支援瀏覽器的擴充插件,也支援手機APP,並且提供多項功能,包括實時雙語字幕翻譯、PDF翻譯功能、雙語EPUB電子書,以及鼠標懸停翻譯等。欲瞭解更多請訪問官網。
Thumbnail
PopPop AI 推出的免費線上音效產生器可以將文字轉換為各種聲音,包括自然、人類、樂器、環境和特殊效果等。支援多種語言,使用者可以輸入中文描述創建音效,並可直接播放聆聽和下載音訊。
Thumbnail
本文主要使用SpeechRecognition來做一個簡單的語音辨識,使用pyqt5介面呈現。 按下Start Recording,開始錄音,並顯示請開始說話。然後按鈕名改名Stop 在按下Stop Recording,稍等片刻後就會呈現出辨識結果​ 程式範例 import sys i
Thumbnail
本文介紹了text-generation-webui的安裝方法和模型的選擇,包括模型的下載和擺放位置,並提供了相關的連結和建議。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
ChatGPT最近更新了語音對話功能,同時推出了附屬功能Read out loud,讓對話更方便。使用者可以立刻知道英文單字的讀音和例句唸法,加上十秒重播功能,非常實用。
Thumbnail
ChatGPT最擅長的就是文本處理,用來翻譯字幕應該也是一片蛋糕吧!但實際操作測試,卻發現沒那麼容易,原因是影片翻譯要考量的因素太多包括: ▪️時間戳記對齊 ▪️適合閱讀且中英文對照文句長度 ▪️貼合講者原意語氣風格 ▪️專業術語與專有名詞 還有GPT一次可以處理的資訊量有限,超過
我測試的文字轉語音工具,我可以導入4000-5000(甚至高達10,000)個單詞來生成我的音頻檔案。 https://www.text-to-speech.online/ https://ttsmaker.com/ 其他工具但對字符數有一些限制: https://ttsfree.
Thumbnail
本文探討了複利效應的重要性,並藉由巴菲特的投資理念,說明如何選擇穩定產生正報酬的資產及長期持有的核心理念。透過定期定額的投資方式,不僅能減少情緒影響,還能持續參與全球股市的發展。此外,文中介紹了使用國泰 Cube App 的便利性及低手續費,幫助投資者簡化投資流程,達成長期穩定增長的財務目標。
Thumbnail
Free Online AI Vocal Remover & Isolator 是一個線上音訊分離工具,運用 AI 技術精準辨識人聲和樂器並自動消除噪音,輸出高品質清晰音訊。上傳音樂或影片即可獲得人聲和伴奏音樂,支援抓取社群影音檔案,提交連結可以免費下載高品質MP3。
Thumbnail
沉浸式翻譯是一款多功能的瀏覽器插件和手機APP,專門為僅懂中文的使用者打造。它支援瀏覽器的擴充插件,也支援手機APP,並且提供多項功能,包括實時雙語字幕翻譯、PDF翻譯功能、雙語EPUB電子書,以及鼠標懸停翻譯等。欲瞭解更多請訪問官網。
Thumbnail
PopPop AI 推出的免費線上音效產生器可以將文字轉換為各種聲音,包括自然、人類、樂器、環境和特殊效果等。支援多種語言,使用者可以輸入中文描述創建音效,並可直接播放聆聽和下載音訊。
Thumbnail
本文主要使用SpeechRecognition來做一個簡單的語音辨識,使用pyqt5介面呈現。 按下Start Recording,開始錄音,並顯示請開始說話。然後按鈕名改名Stop 在按下Stop Recording,稍等片刻後就會呈現出辨識結果​ 程式範例 import sys i
Thumbnail
本文介紹了text-generation-webui的安裝方法和模型的選擇,包括模型的下載和擺放位置,並提供了相關的連結和建議。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
ChatGPT最近更新了語音對話功能,同時推出了附屬功能Read out loud,讓對話更方便。使用者可以立刻知道英文單字的讀音和例句唸法,加上十秒重播功能,非常實用。
Thumbnail
ChatGPT最擅長的就是文本處理,用來翻譯字幕應該也是一片蛋糕吧!但實際操作測試,卻發現沒那麼容易,原因是影片翻譯要考量的因素太多包括: ▪️時間戳記對齊 ▪️適合閱讀且中英文對照文句長度 ▪️貼合講者原意語氣風格 ▪️專業術語與專有名詞 還有GPT一次可以處理的資訊量有限,超過
我測試的文字轉語音工具,我可以導入4000-5000(甚至高達10,000)個單詞來生成我的音頻檔案。 https://www.text-to-speech.online/ https://ttsmaker.com/ 其他工具但對字符數有一些限制: https://ttsfree.