VITS
含有「VITS」共 2 篇內容
全部內容
發佈日期由新至舊
Dino Lee的AI 智識館
2026/05/02
人工智慧如何生成聲音 第五章_深度學習時代的語音生成架構
深度學習時代語音合成的每一步架構演進,本質上都在重新回答同一個問題:哪些決策應該留給人類先驗,哪些可以交由模型從資料中發現。 從對齊到韻律,從頻譜預測到波形生成,從模組管線到整合式框架,這條線索貫穿了 從Tacotron、FastSpeech、到Matcha-TTS 的所有差異。
#
Tacotron
#
FastSpeech
#
WaveNet
1
留言
偽命名培養體
2024/05/19
[人工智障計畫] 難眠之頁 #8 | 給他一個聲音 - VITS 文字轉語音模型快速訓練法
「人工智障計畫」也執行了好一段時間了,關於這個專案中文字轉語音的方案,在之前的筆記中也有稍微提到,為了達成能自訂聲線,並且能完全離線運作兩個條件,我已經做過了不少嘗試。
#
人工智障計畫
#
AI
#
VITS
14
留言