用 SO-VITS-SVC 打造 AI 歌姬，零基礎也能輕鬆上手！-數據集的錄製與準備

Violet

發佈於AI歌姬

2024/12/24 更新2024/12/24 發佈閱讀 5 分鐘

SO-VITS-SVC實戰經驗分享：從零開始打造我的專屬AI歌手

AI唱歌系列之三-數據集的錄製與準備

1. 錄製數據集

如要訓練自己的聲音模型，需要自己錄製數據。步驟如下：

基本要求

數據量需求：

錄音環境準備：選擇安靜地方，避免空曠空間（容易有回音）。

錄音內容建議：

自己熟悉且能完整演唱的歌曲。
不同風格的曲目，快慢都要有，包含高低音（提高模型適應性）。
情感表現豐富的歌曲，豐富的情感變化。
2-4分鐘/首。
最好10-15首不同歌曲。

※注意事項：

無背景音樂、混響、和聲的乾聲。
完整演唱選定歌曲，自然的情感演繹。
保持穩定的音質和音量，避免忽大忽小聲。
確保安靜的錄音環境。

避免：

混入任何說話聲音。
加入伴奏音樂。
使用帶回音的環境。
音量過大失真。

2. 數據集處理

提取人聲的順序流程是分離伴奏——去除和聲——去除混響和回聲。

2-1.伴奏分離

如果使用的是帶伴奏的歌曲作為數據集，請一定要將人聲分離出來。分離人聲及伴奏推薦使用Ultimate Vocal Remover 5（UVR 5），下載對應的處理模型。

可使用的分離伴奏方法，擇一使用：

人聲去除器和AI智慧伴奏分離器 | LALAL.AI。效果還不錯，但不是免費的。
※使用方法可參考：LALALAI使用方法。
使用火山引擎 SAMI 技術。可參考SAMI文檔。
剪映專業版（有VIP）。沒有VIP的可使用剪映專業版+錄屏（沒有聲音損失）。
使用 UVR5 - MDX23C-InstVoc HQ 模型。

使用 Ripple 分離人聲。（蘋果用戶專享）

2-2.去除和聲

使用 UVR5 的去除和聲模型（以下三個擇其一）

UVR-BVE-4B_SN-44100-1 (Instrumental Only)。
6_HP_Karaoke-UVR (Vocals Only)（没有5激烈）。
5_HP_Karaoke-UVR (Vocals Only) （比6激進，有可能會過頭）。

Hit'n'Mix RipX 手動分離出人聲（非必要别用，費時費力）。

2-3.去混響和回聲

使用 UVR5 的去混響模型（以下三個擇其一）。

UVR-De-Echo-Normal選No Echo Only（輕度混響）。
UVR-De-Echo-Aggressive選No Echo Only（重度混響）。
UVR-De-Echo-Dereverb選No Echo Only（遇到變態的混響可以用）。

※ 注意：使用 UVR5 請確保 UVR 版本是最新的，否則可能無法下載所需模型。

2-4.數據集結構與命名規範

1.數據集目錄結構：

數據都處理好之後，可先使用重命名軟件，把檔案名稱都統一，之後的預處理比較不會出錯。
都處理好後，要將數據集放入dataset_raw目錄。
請按照以下文件結構，並且命名只能有英文、數字以及windows允许的特殊符號。

dataset_raw
├───speaker0
│   ├───xxx1-xxx1.wav
│   ├───...
│   └───Lxx-0xx8.wav
└───speaker1
├───xx2-0xxx2.wav
├───...
└───xxx7-xxx007.wav

2.檔案命名規範：

對於每一個音訊檔案的名稱並沒有格式的限制(000001.wav~999999.wav之類的命名方式也是合法的)，不過檔案類型必須是wav。
可以自訂說話者名稱。

dataset_raw
└───suijiSUI
├───1.wav
├───...
└───25788785-20221210-200143-856_01_(Vocals)_0_0.wav

如果追求更精確的選曲，可參考

選擇適合的歌曲和評估方法。

結語：

透過上述步驟與工具，您可以有效準備高質量的數據集，為訓練專屬聲音模型奠定基礎。記得遵循命名規範與工具使用建議，確保整個流程順利進行。

留言

Violet的沙龍-聖誕節快樂！

4會員

4內容數

Hello～歡迎來到Soul in the system。我主要研究心理學，但對於AI很有興趣，這裡目前主要是分享關於AI的各種知識，將來希望能分享心理學。心理學跟AI是可以連結的，歡迎同好～

Violet的沙龍-聖誕節快樂！的其他內容

2024/12/24

用 SO-VITS-SVC 打造 AI 歌姬，零基礎也能輕鬆上手-數據預處理

本文探討使用SO-VITS-SVC進行AI聲音模型訓練的實用經驗，重點在數據集的準備與預處理，包括音頻切片、響度匹配和訓練參數設置等步驟。本文提供了詳細的流程和注意事項，旨在幫助讀者有效完成模型訓練，實現專屬的AI歌手打造。方法涵蓋了使用WebUI進行音訊處理和數據集組織，著重於音質保證和訓練效率。

2024/12/24

用 SO-VITS-SVC 打造 AI 歌姬，零基礎也能輕鬆上手-數據預處理

2024/12/24

用 SO-VITS-SVC 打造 AI 歌姬，零基礎也能輕鬆上手！-數據集準備與環境部署

本篇文章分享瞭如何從零開始使用SO-VITS-SVC構建專屬AI歌手的實戰經驗。重點介紹了數據集的準備和環境的部署，包括硬體需求、Python環境設置及模型訓練的注意事項。作者還分享了雲端訓練和本地訓練的對比，並提醒讀者規範使用資料集避免侵權問題。透過這篇文章，您將獲得構建AI音樂模型的指引和技巧。

2024/12/24

用 SO-VITS-SVC 打造 AI 歌姬，零基礎也能輕鬆上手！-數據集準備與環境部署

2024/12/18

用 SO-VITS-SVC 打造 AI 歌姬，零基礎也能輕鬆上手！

--- SO-VITS-SVC 是一款開源 AI 唱歌模型，作者分享了從零開始打造專屬 AI 歌姬的經驗。從初次接觸 AI 到克服技術門檻，作者驚艷於 AI 的真實歌聲表現，並探索 AI 在聲音生成、繪圖、寫作等領域的潛力。文章提到模型對硬體要求高，未來將分享數據準備與環境部署，幫助讀者輕鬆入門。

2024/12/18

用 SO-VITS-SVC 打造 AI 歌姬，零基礎也能輕鬆上手！

看更多

你可能也想看

k.S的量化投資

【深度解讀】打破百萬門檻迷思：小資族如何透過「債券孳息」打造優於定存的美元現金流？

債券投資，不只是高資產族群的遊戲在傳統的投資觀念中，海外債券（Overseas Bonds）常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻，讓許多想尋求穩定配息的小資族望而卻步。然而，在股市波動劇烈的環境下，尋求穩定的美元現金流與被動收入成為許多投資人

#玉山證券#海外債券#債券孳息

2026/02/06

k.S的量化投資

【深度解讀】打破百萬門檻迷思：小資族如何透過「債券孳息」打造優於定存的美元現金流？

#玉山證券#海外債券#債券孳息

2026/02/06

Jorge2006的沙龍

玉山證券小額債—川普又來報明牌啦!

透過川普的近期債券交易揭露，探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響，以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺，如何讓小資族也能低門檻參與海外債券市場，實現「低門檻、低波動、固定收益」的務實投資方式。

2026/03/13

2026/03/13

拒絕梭哈投資，建立財務餘裕｜玉山證券小額債為你打造資產穩定錨

解析「債券」如何成為資產配置中的穩定錨，提供低風險高回報的投資選項。藉由玉山證券的低門檻債券服務，投資者可輕鬆入手，平衡風險並穩定財務。

#投資#資產配置#債券投資

2026/03/13

CK On Board

拒絕梭哈投資，建立財務餘裕｜玉山證券小額債為你打造資產穩定錨

#投資#資產配置#債券投資

2026/03/13

小芝女看天下

任何人都能投資！用玉山證券小額債替自己存旅費：1,000 美元就能開始的穩健理財法

相較於波動較大的股票，債券能提供固定現金流，而玉山證券推出的小額債，更以1000 美元的低門檻，讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色，大幅降低投資難度，對於希望分散風險、建立穩定現金流的人來說，玉山小額債是一個值得嘗試的理財起點。

#玉山小額債#小額債#玉山證券

2026/02/12