網際智慧 Text-to-speech (TTS)高品質文字轉語音引擎 API 應用介紹
TTS主要應用
Text-to-speech (TTS)高品質文字轉語音引擎應用
- 機器人
- 智慧終端
- 公眾廣播
- 叫號系統/結帳
- 工廠/倉儲自動
- App、網站等數位內容製作
- 有聲出版品
- 無障礙設施與輔具
- IVR電話語音系統
TTS文字轉語音應用特色
1. TTS主要功能
- 將text文字檔的內容,轉換為wav檔,可送到Buffer,播放軟體可以讀取buffer做聲音後處理
- 能自動判斷前後文,自動判斷常用多音字、年份、日期、時間、電話、數字、%…等讀法,也可自訂讀法
- 能瞬間產生音檔,1000字約10秒產生音檔(與CPU及硬碟速度相關)
2. 朗讀内容可自訂發音
- 可透過API調整朗讀快慢、音調高低、音量(speed, pitch, volume)、逗點停頓時間、句點停頓時間
- 可自訂發音(透過字典檔或XML tag)
- 可在文章內文中標註XML來控制發音(speed, pitch, volume等)
3. 中英夾雜朗讀
- 中文夾雜英文單字,中文引擎即可正常朗讀
- 整句英文或文章,就需要搭配英文引擎,才能有抑揚頓挫效果
4. TTS跨平台支援
- Android
- iOS
- Linux, Linux Embedded
- Windows, Windows IoT
- Web網頁
線上文字轉語音網站試聽
文字轉語音功能特色
- 小音庫(約6MB, 主要應用於智慧終端、嵌入系統)
- 標準音庫(約64MB, 主要應用於智慧終端)
- 大音庫(約200MB-600MB, 主要應用於公眾廣播、有聲出版品、電話語音系統)
- 提供8K, 16K, 44K等聲音輸出
多發音人(Speakers)、變音變聲支援
- 提供不同風格的發音人,男生、女生、小孩...。一個語言都有2個以上發音人,又以英、日、韓的發音人最多,有台灣口音的發音人!
- 可選購變聲模組(女變男、變機器人、變小孩...等)
多語言支援
支援中(北京、台灣、廣東)、日、韓、泰、英(美國、英國、澳洲)、法(加拿大、歐洲)、西(墨西哥、歐洲)、葡(巴西、歐洲)、德、荷、俄、瑞典、挪威、阿拉伯等等,持續擴充新語言中
TTS授權類型種類
1.音檔重製、散佈
- 生產音檔,重製/出版:語音試卷、有聲書出版品(影片、聲音)
2.公開播放、公開傳輸
- 公共場所播放:消防隊、學校、車站、機場、捷運、醫院、百貨公司、工廠…等各類廣播系統
- 電話語音系統播放:企業
- 網站播放:E-Learning服務、Youtube影片、數位內容網、無障礙網站
3.個人單機使用