高品質真人文字轉語音TTS API,語音合成技術 (支援多國語言男女聲,Windows/Android/iOS平台)

網際智慧 Text-to-speech (TTS)高品質文字轉語音引擎 API 應用介紹

TTS主要應用

Text-to-speech (TTS)高品質文字轉語音引擎應用
  • 機器人
  • 智慧終端
  • 公眾廣播
  • 叫號系統/結帳
  • 工廠/倉儲自動
  • App、網站等數位內容製作
  • 有聲出版品
  • 無障礙設施與輔具
  • IVR電話語音系統

TTS文字轉語音應用特色

1. TTS主要功能

  • 將text文字檔的內容,轉換為wav檔,可送到Buffer,播放軟體可以讀取buffer做聲音後處理
  • 能自動判斷前後文,自動判斷常用多音字、年份、日期、時間、電話、數字、%…等讀法,也可自訂讀法
  • 能瞬間產生音檔,1000字約10秒產生音檔(與CPU及硬碟速度相關)

2. 朗讀内容可自訂發音

  • 可透過API調整朗讀快慢、音調高低、音量(speed, pitch, volume)、逗點停頓時間、句點停頓時間
  • 可自訂發音(透過字典檔或XML tag)
  • 可在文章內文中標註XML來控制發音(speed, pitch, volume等)

3. 中英夾雜朗讀

  • 中文夾雜英文單字,中文引擎即可正常朗讀
  • 整句英文或文章,就需要搭配英文引擎,才能有抑揚頓挫效果

4. TTS跨平台支援

  • Android
  • iOS
  • Linux, Linux Embedded
  • Windows, Windows IoT
  • Web網頁

線上文字轉語音網站試聽

文字轉語音功能特色

  • 小音庫(約6MB, 主要應用於智慧終端、嵌入系統)
  • 標準音庫(約64MB, 主要應用於智慧終端)
  • 大音庫(約200MB-600MB, 主要應用於公眾廣播、有聲出版品、電話語音系統)
  • 提供8K, 16K, 44K等聲音輸出

多發音人(Speakers)、變音變聲支援

  • 提供不同風格的發音人,男生、女生、小孩...。一個語言都有2個以上發音人,又以英、日、韓的發音人最多,有台灣口音的發音人!
  • 可選購變聲模組(女變男、變機器人、變小孩...等)

多語言支援

支援中(北京、台灣、廣東)、日、韓、泰、英(美國、英國、澳洲)、法(加拿大、歐洲)、西(墨西哥、歐洲)、葡(巴西、歐洲)、德、荷、俄、瑞典、挪威、阿拉伯等等,持續擴充新語言中

TTS授權類型種類

1.音檔重製、散佈

  • 生產音檔,重製/出版:語音試卷、有聲書出版品(影片、聲音)

2.公開播放、公開傳輸

  • 公共場所播放:消防隊、學校、車站、機場、捷運、醫院、百貨公司、工廠…等各類廣播系統
  • 電話語音系統播放:企業
  • 網站播放:E-Learning服務、Youtube影片、數位內容網、無障礙網站

3.個人單機使用

  • 個人單機使用:不公開播放,不重製散佈

介紹AI趨勢、應用工具,為您補給滿滿の AI超能力!
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
聲音相關應用在過去兩年相關熱門,從 Clubhouse 的突然爆紅,Spotify 與國內如 KKBOX、SoundON、Firstory 不斷推動 Podcast 的收聽人數,以及有更多電子書都提供內建的語音朗讀功能,愈來愈多線上客服使用仿真人聲音的服務。 特教考卷報讀、數位聲音 教材製作
試卷報讀範例內容:110 年國中教育會考 您可以將任意Text文字轉換為MP3音檔,可以自訂發音速度快慢,還可以產生朗讀的文字聲音同步檔!文字MP3 提供 中文台灣腔 1男3女聲共4個聲音庫,採用IQ-TTS語音引擎及聲音庫,特別適用於視障試卷朗讀、數位內容教材製作、考試背書音庫...
適合用於視障試卷報讀、背書考試神器、佛經朗讀、Podcast 等使用情境 文字轉語音軟體 免費試用下載 「文字MP3」是將文字轉換為聲音檔的工具軟體(文字轉語音) 您可以將任意Text文字轉換為MP3音檔,可以自訂發音速度快慢,還可以產生朗讀的文字聲音同步檔!
聲音相關應用在過去兩年相關熱門,從 Clubhouse 的突然爆紅,Spotify 與國內如 KKBOX、SoundON、Firstory 不斷推動 Podcast 的收聽人數,以及有更多電子書都提供內建的語音朗讀功能,愈來愈多線上客服使用仿真人聲音的服務。 特教考卷報讀、數位聲音 教材製作
試卷報讀範例內容:110 年國中教育會考 您可以將任意Text文字轉換為MP3音檔,可以自訂發音速度快慢,還可以產生朗讀的文字聲音同步檔!文字MP3 提供 中文台灣腔 1男3女聲共4個聲音庫,採用IQ-TTS語音引擎及聲音庫,特別適用於視障試卷朗讀、數位內容教材製作、考試背書音庫...
適合用於視障試卷報讀、背書考試神器、佛經朗讀、Podcast 等使用情境 文字轉語音軟體 免費試用下載 「文字MP3」是將文字轉換為聲音檔的工具軟體(文字轉語音) 您可以將任意Text文字轉換為MP3音檔,可以自訂發音速度快慢,還可以產生朗讀的文字聲音同步檔!
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
Voice Clone Multilingual 支援克隆聲音的 TTS 工具,用戶可以上傳聲音範本,並支援多種語言,適用於教育和娛樂等多個場景。無需註冊即可使用,並能免費下載生成的 WAV 音訊檔案。讓文字轉語音體驗更上一層樓。
Thumbnail
我們前面幾篇已經講完TTS技術的一大半架構了,知道了如何將聲學特徵重建回音訊波形,也從中可以知道要是聲學特徵不完善,最終取得的結果也會不自然,剩下要探討該如何將文字轉換成聲學特徵,且能夠自然地表現停頓及細節變化,讓我們開始吧。
Thumbnail
今天我要跟大家聊聊 GPT-SoVITS 的用途及其功能。 這個開源的聲音克隆專案,融合了業內頂尖的語音合成工具——GPT (Generative Pre-trained Transformer)模型,和SoVITS(Speech-to-Video Voice Transformation Sys
Thumbnail
  我們在語音初探篇提到TTS的流程可以分成三個部分 :輸入前處理、預測音訊特徵、語音重建,其中輸入前處理的部分上兩篇已經處理完,在進入預測音訊特徵前,讓我們先來理解最後的語音重建部分。
Thumbnail
上篇我們簡單的了解了 TTS 想要達到的目標,但是對於訓練資料的處理、網路架構、損失函數、輸出分析等考慮到篇幅尚未解釋清楚,這篇將針對訓練資料處理中的文字部分進行詳細說明,讓我們開始吧。
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
這篇文章介紹瞭如何將聲音檔轉換為逐字稿,並且提到了使用雲端硬碟安裝colaboratory的方法。這篇文章指出了逐字稿的重要性,以及如何透過逐字稿做文字呈現方式的轉變。如果你需要處理會議紀錄或聲音檔,這些方法都能幫助你更輕鬆的進行工作。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
我測試的文字轉語音工具,我可以導入4000-5000(甚至高達10,000)個單詞來生成我的音頻檔案。 https://www.text-to-speech.online/ https://ttsmaker.com/ 其他工具但對字符數有一些限制: https://ttsfree.
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
Voice Clone Multilingual 支援克隆聲音的 TTS 工具,用戶可以上傳聲音範本,並支援多種語言,適用於教育和娛樂等多個場景。無需註冊即可使用,並能免費下載生成的 WAV 音訊檔案。讓文字轉語音體驗更上一層樓。
Thumbnail
我們前面幾篇已經講完TTS技術的一大半架構了,知道了如何將聲學特徵重建回音訊波形,也從中可以知道要是聲學特徵不完善,最終取得的結果也會不自然,剩下要探討該如何將文字轉換成聲學特徵,且能夠自然地表現停頓及細節變化,讓我們開始吧。
Thumbnail
今天我要跟大家聊聊 GPT-SoVITS 的用途及其功能。 這個開源的聲音克隆專案,融合了業內頂尖的語音合成工具——GPT (Generative Pre-trained Transformer)模型,和SoVITS(Speech-to-Video Voice Transformation Sys
Thumbnail
  我們在語音初探篇提到TTS的流程可以分成三個部分 :輸入前處理、預測音訊特徵、語音重建,其中輸入前處理的部分上兩篇已經處理完,在進入預測音訊特徵前,讓我們先來理解最後的語音重建部分。
Thumbnail
上篇我們簡單的了解了 TTS 想要達到的目標,但是對於訓練資料的處理、網路架構、損失函數、輸出分析等考慮到篇幅尚未解釋清楚,這篇將針對訓練資料處理中的文字部分進行詳細說明,讓我們開始吧。
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
這篇文章介紹瞭如何將聲音檔轉換為逐字稿,並且提到了使用雲端硬碟安裝colaboratory的方法。這篇文章指出了逐字稿的重要性,以及如何透過逐字稿做文字呈現方式的轉變。如果你需要處理會議紀錄或聲音檔,這些方法都能幫助你更輕鬆的進行工作。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
我測試的文字轉語音工具,我可以導入4000-5000(甚至高達10,000)個單詞來生成我的音頻檔案。 https://www.text-to-speech.online/ https://ttsmaker.com/ 其他工具但對字符數有一些限制: https://ttsfree.