網際智慧 Text-to-speech (TTS)高品質文字轉語音引擎 API 應用介紹 TTS主要應用 Text-to-speech (TTS)高品質文字轉語音引擎應用 機器人 智慧終端 公眾廣播 叫號系統/結帳 工廠/倉儲自動 App、網站等數位內容製作 有聲出版品 無障礙設施與輔具 IVR電話語音系統 TTS文字轉語音應用特色 1. TTS主要功能 將text文字檔的內容,轉換為wav檔,可送到Buffer,播放軟體可以讀取buffer做聲音後處理 能自動判斷前後文,自動判斷常用多音字、年份、日期、時間、電話、數字、%…等讀法,也可自訂讀法 能瞬間產生音檔,1000字約10秒產生音檔(與CPU及硬碟速度相關) 2. 朗讀内容可自訂發音 可透過API調整朗讀快慢、音調高低、音量(speed, pitch, volume)、逗點停頓時間、句點停頓時間 可自訂發音(透過字典檔或XML tag) 可在文章內文中標註XML來控制發音(speed, pitch, volume等) 3. 中英夾雜朗讀 中文夾雜英文單字,中文引擎即可正常朗讀 整句英文或文章,就需要搭配英文引擎,才能有抑揚頓挫效果 4. TTS跨平台支援 Android iOS Linux, Linux Embedded Windows, Windows IoT Web網頁 線上文字轉語音網站試聽 https://www.iqt.ai/tts-list https://www.readspeaker.com/ 文字轉語音功能特色 小音庫(約6MB, 主要應用於智慧終端、嵌入系統) 標準音庫(約64MB, 主要應用於智慧終端) 大音庫(約200MB-600MB, 主要應用於公眾廣播、有聲出版品、電話語音系統) 提供8K, 16K, 44K等聲音輸出 多發音人(Speakers)、變音變聲支援 提供不同風格的發音人,男生、女生、小孩...。一個語言都有2個以上發音人,又以英、日、韓的發音人最多,有台灣口音的發音人! 可選購變聲模組(女變男、變機器人、變小孩...等) 多語言支援 支援中(北京、台灣、廣東)、日、韓、泰、英(美國、英國、澳洲)、法(加拿大、歐洲)、西(墨西哥、歐洲)、葡(巴西、歐洲)、德、荷、俄、瑞典、挪威、阿拉伯等等,持續擴充新語言中 TTS授權類型種類 1.音檔重製、散佈 生產音檔,重製/出版:語音試卷、有聲書出版品(影片、聲音) 2.公開播放、公開傳輸 公共場所播放:消防隊、學校、車站、機場、捷運、醫院、百貨公司、工廠…等各類廣播系統 電話語音系統播放:企業 網站播放:E-Learning服務、Youtube影片、數位內容網、無障礙網站 3.個人單機使用 個人單機使用:不公開播放,不重製散佈