用 SO-VITS-SVC 打造 AI 歌姬,零基礎也能輕鬆上手!-數據集的錄製與準備

更新於 發佈於 閱讀時間約 5 分鐘




SO-VITS-SVC實戰經驗分享:從零開始打造我的專屬AI歌手




AI唱歌系列之三-數據集的錄製與準備



raw-image



1. 錄製數據集

如要訓練自己的聲音模型,需要自己錄製數據。步驟如下:



基本要求


數據量需求:

raw-image








錄音環境準備:選擇安靜地方,避免空曠空間(容易有回音)。


錄音內容建議:

  • 自己熟悉且能完整演唱的歌曲。
  • 不同風格的曲目,快慢都要有,包含高低音(提高模型適應性)。
  • 情感表現豐富的歌曲,豐富的情感變化。
  • 2-4分鐘/首。
  • 最好10-15首不同歌曲。


※注意事項:

  • 無背景音樂、混響、和聲的乾聲。
  • 完整演唱選定歌曲,自然的情感演繹。
  • 保持穩定的音質和音量,避免忽大忽小聲。
  • 確保安靜的錄音環境。


避免:

  • 混入任何說話聲音。
  • 加入伴奏音樂。
  • 使用帶回音的環境。
  • 音量過大失真。



2. 數據集處理

提取人聲的順序流程是分離伴奏——去除和聲——去除混響和回聲。



2-1.伴奏分離

如果使用的是帶伴奏的歌曲作為數據集,請一定要將人聲分離出來。分離人聲及伴奏推薦使用Ultimate Vocal Remover 5(UVR 5),下載對應的處理模型。

可使用的分離伴奏方法,擇一使用:

  1. 人聲去除器和AI智慧伴奏分離器 | LALAL.AI。效果還不錯,但不是免費的。
    ※使用方法可參考:LALALAI使用方法。
  2. 使用火山引擎 SAMI 技術。可參考SAMI文檔。
  3. 剪映專業版(有VIP)。沒有VIP的可使用剪映專業版+錄屏(沒有聲音損失)。
  4. 使用 UVR5 - MDX23C-InstVoc HQ 模型。
raw-image


  1. 使用 Ripple 分離人聲。(蘋果用戶專享)



2-2.去除和聲

  1. 使用 UVR5 的去除和聲模型(以下三個擇其一)
  • UVR-BVE-4B_SN-44100-1 (Instrumental Only)。
  • 6_HP_Karaoke-UVR (Vocals Only)(没有5激烈)。
  • 5_HP_Karaoke-UVR (Vocals Only) (比6激進,有可能會過頭)。
  1. Hit'n'Mix RipX 手動分離出人聲(非必要别用,費時費力)。



2-3.去混響和回聲

  1. 使用 UVR5 的去混響模型(以下三個擇其一)。
  • UVR-De-Echo-Normal選No Echo Only(輕度混響)。
  • UVR-De-Echo-Aggressive選No Echo Only(重度混響)。
  • UVR-De-Echo-Dereverb選No Echo Only(遇到變態的混響可以用)。
raw-image








※ 注意:使用 UVR5 請確保 UVR 版本是最新的,否則可能無法下載所需模型。



2-4.數據集結構與命名規範


1.數據集目錄結構:

  • 數據都處理好之後,可先使用重命名軟件,把檔案名稱都統一,之後的預處理比較不會出錯。
  • 都處理好後,要將數據集放入dataset_raw目錄。
  • 請按照以下文件結構,並且命名只能有英文、數字以及windows允许的特殊符號。
dataset_raw
├───speaker0
│ ├───xxx1-xxx1.wav
│ ├───...
│ └───Lxx-0xx8.wav
└───speaker1
├───xx2-0xxx2.wav
├───...
└───xxx7-xxx007.wav


2.檔案命名規範:

  • 對於每一個音訊檔案的名稱並沒有格式的限制(000001.wav~999999.wav之類的命名方式也是合法的),不過檔案類型必須是wav。
  • 可以自訂說話者名稱。
dataset_raw
└───suijiSUI
├───1.wav
├───...
└───25788785-20221210-200143-856_01_(Vocals)_0_0.wav


如果追求更精確的選曲,可參考

選擇適合的歌曲和評估方法。


結語:

透過上述步驟與工具,您可以有效準備高質量的數據集,為訓練專屬聲音模型奠定基礎。記得遵循命名規範與工具使用建議,確保整個流程順利進行。

留言
avatar-img
留言分享你的想法!
*違規帳戶-avatar-img
2024/12/27
想請問UVR5如果沒有GPU的話用CPU可以跑嗎?
Violet-avatar-img
發文者
2024/12/24
avatar-img
Violet的沙龍-聖誕節快樂!
4會員
4內容數
Hello~ 歡迎來到Soul in the system。我主要研究心理學,但對於AI很有興趣,這裡目前主要是分享關於AI的各種知識,將來希望能分享心理學。 心理學跟AI是可以連結的,歡迎同好~
2024/12/24
本文探討使用SO-VITS-SVC進行AI聲音模型訓練的實用經驗,重點在數據集的準備與預處理,包括音頻切片、響度匹配和訓練參數設置等步驟。本文提供了詳細的流程和注意事項,旨在幫助讀者有效完成模型訓練,實現專屬的AI歌手打造。方法涵蓋了使用WebUI進行音訊處理和數據集組織,著重於音質保證和訓練效率。
Thumbnail
2024/12/24
本文探討使用SO-VITS-SVC進行AI聲音模型訓練的實用經驗,重點在數據集的準備與預處理,包括音頻切片、響度匹配和訓練參數設置等步驟。本文提供了詳細的流程和注意事項,旨在幫助讀者有效完成模型訓練,實現專屬的AI歌手打造。方法涵蓋了使用WebUI進行音訊處理和數據集組織,著重於音質保證和訓練效率。
Thumbnail
2024/12/24
本篇文章分享瞭如何從零開始使用SO-VITS-SVC構建專屬AI歌手的實戰經驗。重點介紹了數據集的準備和環境的部署,包括硬體需求、Python環境設置及模型訓練的注意事項。作者還分享了雲端訓練和本地訓練的對比,並提醒讀者規範使用資料集避免侵權問題。透過這篇文章,您將獲得構建AI音樂模型的指引和技巧。
Thumbnail
2024/12/24
本篇文章分享瞭如何從零開始使用SO-VITS-SVC構建專屬AI歌手的實戰經驗。重點介紹了數據集的準備和環境的部署,包括硬體需求、Python環境設置及模型訓練的注意事項。作者還分享了雲端訓練和本地訓練的對比,並提醒讀者規範使用資料集避免侵權問題。透過這篇文章,您將獲得構建AI音樂模型的指引和技巧。
Thumbnail
2024/12/18
--- SO-VITS-SVC 是一款開源 AI 唱歌模型,作者分享了從零開始打造專屬 AI 歌姬的經驗。從初次接觸 AI 到克服技術門檻,作者驚艷於 AI 的真實歌聲表現,並探索 AI 在聲音生成、繪圖、寫作等領域的潛力。文章提到模型對硬體要求高,未來將分享數據準備與環境部署,幫助讀者輕鬆入門。
Thumbnail
2024/12/18
--- SO-VITS-SVC 是一款開源 AI 唱歌模型,作者分享了從零開始打造專屬 AI 歌姬的經驗。從初次接觸 AI 到克服技術門檻,作者驚艷於 AI 的真實歌聲表現,並探索 AI 在聲音生成、繪圖、寫作等領域的潛力。文章提到模型對硬體要求高,未來將分享數據準備與環境部署,幫助讀者輕鬆入門。
Thumbnail
看更多
你可能也想看
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
用一首歌做靈感、從零開始構思角色與劇情大綱——本篇實作示範如何結合 AI 助力,快速整理故事雛型。從人物設定、情節轉折到章節架構,手把手帶你看一個完整故事如何誕生。寫作卡關?靈感太亂?這篇教你怎麼和 AI 聊出清晰大綱,一起寫出屬於你的動人故事。
Thumbnail
用一首歌做靈感、從零開始構思角色與劇情大綱——本篇實作示範如何結合 AI 助力,快速整理故事雛型。從人物設定、情節轉折到章節架構,手把手帶你看一個完整故事如何誕生。寫作卡關?靈感太亂?這篇教你怎麼和 AI 聊出清晰大綱,一起寫出屬於你的動人故事。
Thumbnail
當今 AI 工具眾多,但對一些非技術背景的人來說,往往難以上手,我決定定期嘗試不同種類的 AI 工具,探索科技的效益。過年期間為了創作賀新年歌曲,我運用音樂創作 AI - Suno (免費版)。 這篇文章記錄身為音樂小白的我,如何在 1 小時內從探索到整理,並最終生成了一首連自己都驚訝的音樂!
Thumbnail
當今 AI 工具眾多,但對一些非技術背景的人來說,往往難以上手,我決定定期嘗試不同種類的 AI 工具,探索科技的效益。過年期間為了創作賀新年歌曲,我運用音樂創作 AI - Suno (免費版)。 這篇文章記錄身為音樂小白的我,如何在 1 小時內從探索到整理,並最終生成了一首連自己都驚訝的音樂!
Thumbnail
最近,開始籌劃自己的 Podcast,想做一段專屬片頭曲增加節目的風格感。但因為我不是音樂高手,所以我決定找找看有沒有能幫助我創作音樂的 AI 工具。於是,我發現了一個超好玩的AI 音樂網站 Udio!! Udio是什麼? Udio是一個易用的 AI 音樂創作平台。只需要輸入簡單的指令,就能生成
Thumbnail
最近,開始籌劃自己的 Podcast,想做一段專屬片頭曲增加節目的風格感。但因為我不是音樂高手,所以我決定找找看有沒有能幫助我創作音樂的 AI 工具。於是,我發現了一個超好玩的AI 音樂網站 Udio!! Udio是什麼? Udio是一個易用的 AI 音樂創作平台。只需要輸入簡單的指令,就能生成
Thumbnail
本文探討使用SO-VITS-SVC進行AI聲音模型訓練的實用經驗,重點在數據集的準備與預處理,包括音頻切片、響度匹配和訓練參數設置等步驟。本文提供了詳細的流程和注意事項,旨在幫助讀者有效完成模型訓練,實現專屬的AI歌手打造。方法涵蓋了使用WebUI進行音訊處理和數據集組織,著重於音質保證和訓練效率。
Thumbnail
本文探討使用SO-VITS-SVC進行AI聲音模型訓練的實用經驗,重點在數據集的準備與預處理,包括音頻切片、響度匹配和訓練參數設置等步驟。本文提供了詳細的流程和注意事項,旨在幫助讀者有效完成模型訓練,實現專屬的AI歌手打造。方法涵蓋了使用WebUI進行音訊處理和數據集組織,著重於音質保證和訓練效率。
Thumbnail
本文分享瞭如何從零開始打造專屬AI歌手的實戰經驗,特別針對數據集的錄製和準備過程。將討論錄製數據集的基本要求、數據處理流程,包括伴奏分離、去除和聲、去混響等步驟。文章提供了具體的操作建議,幫助讀者有效準備高質量的數據集,為訓練聲音模型鋪路。
Thumbnail
本文分享瞭如何從零開始打造專屬AI歌手的實戰經驗,特別針對數據集的錄製和準備過程。將討論錄製數據集的基本要求、數據處理流程,包括伴奏分離、去除和聲、去混響等步驟。文章提供了具體的操作建議,幫助讀者有效準備高質量的數據集,為訓練聲音模型鋪路。
Thumbnail
本篇文章分享瞭如何從零開始使用SO-VITS-SVC構建專屬AI歌手的實戰經驗。重點介紹了數據集的準備和環境的部署,包括硬體需求、Python環境設置及模型訓練的注意事項。作者還分享了雲端訓練和本地訓練的對比,並提醒讀者規範使用資料集避免侵權問題。透過這篇文章,您將獲得構建AI音樂模型的指引和技巧。
Thumbnail
本篇文章分享瞭如何從零開始使用SO-VITS-SVC構建專屬AI歌手的實戰經驗。重點介紹了數據集的準備和環境的部署,包括硬體需求、Python環境設置及模型訓練的注意事項。作者還分享了雲端訓練和本地訓練的對比,並提醒讀者規範使用資料集避免侵權問題。透過這篇文章,您將獲得構建AI音樂模型的指引和技巧。
Thumbnail
▋前言|心態 因為是學習語言用,所以我盡可能不耗費太多心力。 Q. 為什麼? A. 消耗毅力過多的話,容易堅持不下去。 順從人性!容易、i+1的分量,有助於每天一點的堅持學習下去。 用因如此,過程能多簡單,就多簡單。 別複雜化了! 目標明確:學習語言,不是創作!
Thumbnail
▋前言|心態 因為是學習語言用,所以我盡可能不耗費太多心力。 Q. 為什麼? A. 消耗毅力過多的話,容易堅持不下去。 順從人性!容易、i+1的分量,有助於每天一點的堅持學習下去。 用因如此,過程能多簡單,就多簡單。 別複雜化了! 目標明確:學習語言,不是創作!
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News