高品質真人文字轉語音TTS API,語音合成技術 (支援多國語言男女聲,Windows/Android/iOS平台)

網際智慧 Text-to-speech (TTS)高品質文字轉語音引擎 API 應用介紹

TTS主要應用

Text-to-speech (TTS)高品質文字轉語音引擎應用
  • 機器人
  • 智慧終端
  • 公眾廣播
  • 叫號系統/結帳
  • 工廠/倉儲自動
  • App、網站等數位內容製作
  • 有聲出版品
  • 無障礙設施與輔具
  • IVR電話語音系統

TTS文字轉語音應用特色

1. TTS主要功能

  • 將text文字檔的內容,轉換為wav檔,可送到Buffer,播放軟體可以讀取buffer做聲音後處理
  • 能自動判斷前後文,自動判斷常用多音字、年份、日期、時間、電話、數字、%…等讀法,也可自訂讀法
  • 能瞬間產生音檔,1000字約10秒產生音檔(與CPU及硬碟速度相關)

2. 朗讀内容可自訂發音

  • 可透過API調整朗讀快慢、音調高低、音量(speed, pitch, volume)、逗點停頓時間、句點停頓時間
  • 可自訂發音(透過字典檔或XML tag)
  • 可在文章內文中標註XML來控制發音(speed, pitch, volume等)

3. 中英夾雜朗讀

  • 中文夾雜英文單字,中文引擎即可正常朗讀
  • 整句英文或文章,就需要搭配英文引擎,才能有抑揚頓挫效果

4. TTS跨平台支援

  • Android
  • iOS
  • Linux, Linux Embedded
  • Windows, Windows IoT
  • Web網頁

線上文字轉語音網站試聽

文字轉語音功能特色

  • 小音庫(約6MB, 主要應用於智慧終端、嵌入系統)
  • 標準音庫(約64MB, 主要應用於智慧終端)
  • 大音庫(約200MB-600MB, 主要應用於公眾廣播、有聲出版品、電話語音系統)
  • 提供8K, 16K, 44K等聲音輸出

多發音人(Speakers)、變音變聲支援

  • 提供不同風格的發音人,男生、女生、小孩...。一個語言都有2個以上發音人,又以英、日、韓的發音人最多,有台灣口音的發音人!
  • 可選購變聲模組(女變男、變機器人、變小孩...等)

多語言支援

支援中(北京、台灣、廣東)、日、韓、泰、英(美國、英國、澳洲)、法(加拿大、歐洲)、西(墨西哥、歐洲)、葡(巴西、歐洲)、德、荷、俄、瑞典、挪威、阿拉伯等等,持續擴充新語言中

TTS授權類型種類

1.音檔重製、散佈

  • 生產音檔,重製/出版:語音試卷、有聲書出版品(影片、聲音)

2.公開播放、公開傳輸

  • 公共場所播放:消防隊、學校、車站、機場、捷運、醫院、百貨公司、工廠…等各類廣播系統
  • 電話語音系統播放:企業
  • 網站播放:E-Learning服務、Youtube影片、數位內容網、無障礙網站

3.個人單機使用

  • 個人單機使用:不公開播放,不重製散佈

介紹AI趨勢、應用工具,為您補給滿滿の AI超能力!
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
聲音相關應用在過去兩年相關熱門,從 Clubhouse 的突然爆紅,Spotify 與國內如 KKBOX、SoundON、Firstory 不斷推動 Podcast 的收聽人數,以及有更多電子書都提供內建的語音朗讀功能,愈來愈多線上客服使用仿真人聲音的服務。 特教考卷報讀、數位聲音 教材製作
試卷報讀範例內容:110 年國中教育會考 您可以將任意Text文字轉換為MP3音檔,可以自訂發音速度快慢,還可以產生朗讀的文字聲音同步檔!文字MP3 提供 中文台灣腔 1男3女聲共4個聲音庫,採用IQ-TTS語音引擎及聲音庫,特別適用於視障試卷朗讀、數位內容教材製作、考試背書音庫...
適合用於視障試卷報讀、背書考試神器、佛經朗讀、Podcast 等使用情境 文字轉語音軟體 免費試用下載 「文字MP3」是將文字轉換為聲音檔的工具軟體(文字轉語音) 您可以將任意Text文字轉換為MP3音檔,可以自訂發音速度快慢,還可以產生朗讀的文字聲音同步檔!
聲音相關應用在過去兩年相關熱門,從 Clubhouse 的突然爆紅,Spotify 與國內如 KKBOX、SoundON、Firstory 不斷推動 Podcast 的收聽人數,以及有更多電子書都提供內建的語音朗讀功能,愈來愈多線上客服使用仿真人聲音的服務。 特教考卷報讀、數位聲音 教材製作
試卷報讀範例內容:110 年國中教育會考 您可以將任意Text文字轉換為MP3音檔,可以自訂發音速度快慢,還可以產生朗讀的文字聲音同步檔!文字MP3 提供 中文台灣腔 1男3女聲共4個聲音庫,採用IQ-TTS語音引擎及聲音庫,特別適用於視障試卷朗讀、數位內容教材製作、考試背書音庫...
適合用於視障試卷報讀、背書考試神器、佛經朗讀、Podcast 等使用情境 文字轉語音軟體 免費試用下載 「文字MP3」是將文字轉換為聲音檔的工具軟體(文字轉語音) 您可以將任意Text文字轉換為MP3音檔,可以自訂發音速度快慢,還可以產生朗讀的文字聲音同步檔!
你可能也想看
Google News 追蹤
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
Voice Clone Multilingual 支援克隆聲音的 TTS 工具,用戶可以上傳聲音範本,並支援多種語言,適用於教育和娛樂等多個場景。無需註冊即可使用,並能免費下載生成的 WAV 音訊檔案。讓文字轉語音體驗更上一層樓。
Thumbnail
我們前面幾篇已經講完TTS技術的一大半架構了,知道了如何將聲學特徵重建回音訊波形,也從中可以知道要是聲學特徵不完善,最終取得的結果也會不自然,剩下要探討該如何將文字轉換成聲學特徵,且能夠自然地表現停頓及細節變化,讓我們開始吧。
Thumbnail
今天我要跟大家聊聊 GPT-SoVITS 的用途及其功能。 這個開源的聲音克隆專案,融合了業內頂尖的語音合成工具——GPT (Generative Pre-trained Transformer)模型,和SoVITS(Speech-to-Video Voice Transformation Sys
Thumbnail
  我們在語音初探篇提到TTS的流程可以分成三個部分 :輸入前處理、預測音訊特徵、語音重建,其中輸入前處理的部分上兩篇已經處理完,在進入預測音訊特徵前,讓我們先來理解最後的語音重建部分。
Thumbnail
上篇我們簡單的了解了 TTS 想要達到的目標,但是對於訓練資料的處理、網路架構、損失函數、輸出分析等考慮到篇幅尚未解釋清楚,這篇將針對訓練資料處理中的文字部分進行詳細說明,讓我們開始吧。
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
這篇文章介紹瞭如何將聲音檔轉換為逐字稿,並且提到了使用雲端硬碟安裝colaboratory的方法。這篇文章指出了逐字稿的重要性,以及如何透過逐字稿做文字呈現方式的轉變。如果你需要處理會議紀錄或聲音檔,這些方法都能幫助你更輕鬆的進行工作。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
我測試的文字轉語音工具,我可以導入4000-5000(甚至高達10,000)個單詞來生成我的音頻檔案。 https://www.text-to-speech.online/ https://ttsmaker.com/ 其他工具但對字符數有一些限制: https://ttsfree.
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
Voice Clone Multilingual 支援克隆聲音的 TTS 工具,用戶可以上傳聲音範本,並支援多種語言,適用於教育和娛樂等多個場景。無需註冊即可使用,並能免費下載生成的 WAV 音訊檔案。讓文字轉語音體驗更上一層樓。
Thumbnail
我們前面幾篇已經講完TTS技術的一大半架構了,知道了如何將聲學特徵重建回音訊波形,也從中可以知道要是聲學特徵不完善,最終取得的結果也會不自然,剩下要探討該如何將文字轉換成聲學特徵,且能夠自然地表現停頓及細節變化,讓我們開始吧。
Thumbnail
今天我要跟大家聊聊 GPT-SoVITS 的用途及其功能。 這個開源的聲音克隆專案,融合了業內頂尖的語音合成工具——GPT (Generative Pre-trained Transformer)模型,和SoVITS(Speech-to-Video Voice Transformation Sys
Thumbnail
  我們在語音初探篇提到TTS的流程可以分成三個部分 :輸入前處理、預測音訊特徵、語音重建,其中輸入前處理的部分上兩篇已經處理完,在進入預測音訊特徵前,讓我們先來理解最後的語音重建部分。
Thumbnail
上篇我們簡單的了解了 TTS 想要達到的目標,但是對於訓練資料的處理、網路架構、損失函數、輸出分析等考慮到篇幅尚未解釋清楚,這篇將針對訓練資料處理中的文字部分進行詳細說明,讓我們開始吧。
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
這篇文章介紹瞭如何將聲音檔轉換為逐字稿,並且提到了使用雲端硬碟安裝colaboratory的方法。這篇文章指出了逐字稿的重要性,以及如何透過逐字稿做文字呈現方式的轉變。如果你需要處理會議紀錄或聲音檔,這些方法都能幫助你更輕鬆的進行工作。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
我測試的文字轉語音工具,我可以導入4000-5000(甚至高達10,000)個單詞來生成我的音頻檔案。 https://www.text-to-speech.online/ https://ttsmaker.com/ 其他工具但對字符數有一些限制: https://ttsfree.