vocus logo

方格子 vocus

高品質真人文字轉語音TTS API,語音合成技術 (支援多國語言男女聲,Windows/Android/iOS平台)

網際智慧 Text-to-speech (TTS)高品質文字轉語音引擎 API 應用介紹


TTS主要應用

vocus|新世代的創作平台
  • 機器人
  • 智慧終端
  • 公眾廣播
  • 叫號系統/結帳
  • 工廠/倉儲自動
  • App、網站等數位內容製作
  • 有聲出版品
  • 無障礙設施與輔具
  • IVR電話語音系統


TTS文字轉語音應用特色

1. TTS主要功能

  • 將text文字檔的內容,轉換為wav檔,可送到Buffer,播放軟體可以讀取buffer做聲音後處理
  • 能自動判斷前後文,自動判斷常用多音字、年份、日期、時間、電話、數字、%…等讀法,也可自訂讀法
  • 能瞬間產生音檔,1000字約10秒產生音檔(與CPU及硬碟速度相關)

2. 朗讀内容可自訂發音

  • 可透過API調整朗讀快慢、音調高低、音量(speed, pitch, volume)、逗點停頓時間、句點停頓時間
  • 可自訂發音(透過字典檔或XML tag)
  • 可在文章內文中標註XML來控制發音(speed, pitch, volume等)

3. 中英夾雜朗讀

  • 中文夾雜英文單字,中文引擎即可正常朗讀
  • 整句英文或文章,就需要搭配英文引擎,才能有抑揚頓挫效果

4. TTS跨平台支援

  • Android
  • iOS
  • Linux, Linux Embedded
  • Windows, Windows IoT
  • Web網頁


線上文字轉語音網站試聽


文字轉語音功能特色

  • 小音庫(約6MB, 主要應用於智慧終端、嵌入系統)
  • 標準音庫(約64MB, 主要應用於智慧終端)
  • 大音庫(約200MB-600MB, 主要應用於公眾廣播、有聲出版品、電話語音系統)
  • 提供8K, 16K, 44K等聲音輸出
vocus|新世代的創作平台

多發音人(Speakers)、變音變聲支援

  • 提供不同風格的發音人,男生、女生、小孩...。一個語言都有2個以上發音人,又以英、日、韓的發音人最多,有台灣口音的發音人!
  • 可選購變聲模組(女變男、變機器人、變小孩...等)

多語言支援

支援中(北京、台灣、廣東)、日、韓、泰、英(美國、英國、澳洲)、法(加拿大、歐洲)、西(墨西哥、歐洲)、葡(巴西、歐洲)、德、荷、俄、瑞典、挪威、阿拉伯等等,持續擴充新語言中


TTS授權類型種類

1.音檔重製、散佈

  • 生產音檔,重製/出版:語音試卷、有聲書出版品(影片、聲音)

2.公開播放、公開傳輸

  • 公共場所播放:消防隊、學校、車站、機場、捷運、醫院、百貨公司、工廠…等各類廣播系統
  • 電話語音系統播放:企業
  • 網站播放:E-Learning服務、Youtube影片、數位內容網、無障礙網站

3.個人單機使用

  • 個人單機使用:不公開播放,不重製散佈







留言
avatar-img
GPT工作術|與你一起補給工作的AI能量沙龍
69會員
106內容數
介紹AI趨勢、應用工具,為您補給滿滿の AI超能力!
2024/09/01
最近因為西遊記改編遊戲「黑神話 悟空」熱賣,所以相關討論很多,但如果想用有聲書方式輕鬆複習一下西遊記原著小說,查詢後發現網路上以大陸的口音居多數的有聲內容,口音或許可能聽不習慣。利用AI將西遊記106回的內容改寫成口語化版本,並配上適合傳統文學的聲音,讓聽者能輕鬆理解。 過去出版社製作
Thumbnail
2024/09/01
最近因為西遊記改編遊戲「黑神話 悟空」熱賣,所以相關討論很多,但如果想用有聲書方式輕鬆複習一下西遊記原著小說,查詢後發現網路上以大陸的口音居多數的有聲內容,口音或許可能聽不習慣。利用AI將西遊記106回的內容改寫成口語化版本,並配上適合傳統文學的聲音,讓聽者能輕鬆理解。 過去出版社製作
Thumbnail
2024/08/01
你有沒有發現現在我們周圍到處都是 AI 的聲音,但怎麼聽起來都怪怪的?沒錯,那些 AI 聲音大多都是外國腔,從 YouTube 影片到 TikTok 短影音,滿耳聽到的都是不太對勁的口音,聽起來有些彆扭。 所以呢,網際智慧跳了出來:「我們要來個大改造!」,推出了一個有點酷的計畫...
Thumbnail
2024/08/01
你有沒有發現現在我們周圍到處都是 AI 的聲音,但怎麼聽起來都怪怪的?沒錯,那些 AI 聲音大多都是外國腔,從 YouTube 影片到 TikTok 短影音,滿耳聽到的都是不太對勁的口音,聽起來有些彆扭。 所以呢,網際智慧跳了出來:「我們要來個大改造!」,推出了一個有點酷的計畫...
Thumbnail
2023/08/21
淺淺分析一下,「山道猴子的一生」為何爆紅? 在這個流量被各種管道瓜分的時代,觀看次數還能破百萬,真的非常難得。 其中,男女主角的配音居然來自於AI合成?只需要一鍵,就能快速還原出男女主角的聲音? 讓我們示範如何利用「文字MP3專業版」還原「山道猴子的一生」的人聲配音吧!
Thumbnail
2023/08/21
淺淺分析一下,「山道猴子的一生」為何爆紅? 在這個流量被各種管道瓜分的時代,觀看次數還能破百萬,真的非常難得。 其中,男女主角的配音居然來自於AI合成?只需要一鍵,就能快速還原出男女主角的聲音? 讓我們示範如何利用「文字MP3專業版」還原「山道猴子的一生」的人聲配音吧!
Thumbnail
看更多
你可能也想看
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
在這個瞬息萬變的時代,數位行銷佔據著無比重要的地立。消費者如今更依賴網絡搜索、社交平台和手機應用程式。這樣的趨勢既為數位行銷帶來機遇,也帶來挑戰。要在這場競爭中脫穎而出,我們需要利用更加智能化的AI工具。
Thumbnail
在這個瞬息萬變的時代,數位行銷佔據著無比重要的地立。消費者如今更依賴網絡搜索、社交平台和手機應用程式。這樣的趨勢既為數位行銷帶來機遇,也帶來挑戰。要在這場競爭中脫穎而出,我們需要利用更加智能化的AI工具。
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
調校電腦系統軟硬體,開啟 ChatGPT 的語音外掛,擴增 ChatGPT 的語音功能,升級進化 AI !!!
Thumbnail
調校電腦系統軟硬體,開啟 ChatGPT 的語音外掛,擴增 ChatGPT 的語音功能,升級進化 AI !!!
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本文介紹了一種全程免費的方法來快速將長時間的音檔轉為逐字稿,不需要花費任何費用。作者建議使用OpenAI的Playground,其中有一個語音轉文字的功能,並支援多種語言。相較於其他需要付費的AI語音轉文字程式,OpenAI的Playground效果非常好,是會議記錄人員的福音。現在,你不需要再花費
Thumbnail
本文介紹了一種全程免費的方法來快速將長時間的音檔轉為逐字稿,不需要花費任何費用。作者建議使用OpenAI的Playground,其中有一個語音轉文字的功能,並支援多種語言。相較於其他需要付費的AI語音轉文字程式,OpenAI的Playground效果非常好,是會議記錄人員的福音。現在,你不需要再花費
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
調校電腦系統軟硬體,開啟 ChatGPT 的語音外掛,擴增 ChatGPT 的語音功能,升級進化 AI !!!
Thumbnail
調校電腦系統軟硬體,開啟 ChatGPT 的語音外掛,擴增 ChatGPT 的語音功能,升級進化 AI !!!
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
多數人接收訊息、學習新知還是用「看」為主,但由於現今時間變得碎片化,不再像過往有完整的時間能夠集中專注在閱讀或學習一個主題,在這樣的趨勢下,我們的學習方式也必須隨之轉變,而這也是「聲音經濟」崛起的關鍵。 - 「聲音經濟」是什麼? - 為什麼用「聽」的學習方式會更快? - 一般人如何簡單運用 Cha
Thumbnail
多數人接收訊息、學習新知還是用「看」為主,但由於現今時間變得碎片化,不再像過往有完整的時間能夠集中專注在閱讀或學習一個主題,在這樣的趨勢下,我們的學習方式也必須隨之轉變,而這也是「聲音經濟」崛起的關鍵。 - 「聲音經濟」是什麼? - 為什麼用「聽」的學習方式會更快? - 一般人如何簡單運用 Cha
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News