讓 AI 模仿 Gura 唱強風大背頭 | AICover

閱讀時間約 4 分鐘

成果| 直接放開頭

隱隱約約有點 Gura 聲音的味道,但還有很大的提升空間。

使用之聲音素材的相關音樂作者與 VTubers 之連結如下:

<強風大背頭>(強風オールバック)原曲作者 Yukopi 的 YouTube 頻道

「鯊鯊」Gawr Gura(hololive 所屬)的 YouTube 頻道

「菁櫻」 さくらみこ(hololive 所屬)的 YouTube 頻道


流程 | 我的第一次,稱不上是心得/教學

使用的 Google Colab 上的 webUI 介面,其作者的速成教學影片(英文):

頻道在這裡

總之先搞首歌曲的 mp3 或 wav 或 FLAC 檔案

辦法很多,請自己想辦法。

把歌聲和配樂拆成兩個聲音檔

最簡單暴力的方法就是上傳至 X-Minus 網站,讓其自動幫你拆。

但實際上我失敗了

但實際上我失敗了

但實際上 X-Minus 沒有成功幫我拆開,所以我是從 Git 下載了 Ultimate Vocal Remover GUI v5.5.1 安裝檔安裝該軟體:

Git 上的載點

Mediafire 上的載點 (Mirror)

安裝完後打開軟體介面如下:

raw-image

Select Input 是選擇想要拆開的音源檔案

Select Output 是想存檔的路徑

除了 GPU Conversion 是我額外勾選的選項外,其他的選項我全部使用預設值

點擊 Start Processing 就會開始拆分,靜等跑完即可。拆分出來的檔案(預設是 WAV 格式)標示 _(Vocals) 的是歌聲,_(Instrumental) 的是配樂。


準備訓練好的聲音 Cover 模型

這篇不談如何訓練,而是找現成的來用,我是從 Hugging Face 的 QuickWick 處下載的。

因為字母排序之故,Gura的需要點擊頁面底部的 Load more files 數次才會刷出來,然後下載。(如果知道直接搜尋找檔的方法,請務必留言教我,感謝!

下載來的聲音 cover 模型是 .zip 檔案,不用解壓縮。


把聲音模型上傳至 Google Drive

接著要把聲音模型上傳至 Google Drive,以供接著要使用的軟體程式存取。可能其他雲端檔案分享服務也可以,但我沒試過。請注意:如果是放在 Google Drive,該檔案的權限需要設定成只要有分享連結者都可以讀取


壓軸來了 - Easy GUI | 要來搞音樂啦

再來就是前往影片作者提供的 Google Colab webUI 了。

raw-image

別懷疑,打開全是文字幾乎看不到任何圖形介面的地方,沒有跑錯,因為這是安裝頁面。我對 Colab 完全不熟悉,所以我也不知道這是安裝到我的 Google 空間去了還是安裝到本地的哪個地方?

總而言之,流程基本上就是跑每一個步驟 (Step) 的程序,絕大多數就是點擊那個像是播放鍵的小圖示,Step 1. 的在這:

raw-image

點擊後圖示會變中間是方塊的:

raw-image

Step 1.  請等方塊跑完變回三角,就是安裝完成。如果安裝失敗基本上就是系統軟硬體(很可能需要 NVIDIA 的顯卡)不支援,我沒有辦法幫忙。


Step 2. 就是提供剛才上傳至雲端的聲音模型連結,然後按下圖左上的圖示:

raw-image

也是等到圖示從方塊變回三角形,且出現以下訊息時,即代表上傳成功:

raw-image

進入啟動軟體的 Step 3.

raw-image

也是在Step 3.項目下找同樣的三角圖示按

raw-image

這次圖示變方塊後再等一會,上圖顯示程式碼的下方會出現一些程式碼,包括:

raw-image

有用過 Stable Diffusion 的應該對第一行的網址很熟悉,意思是於本地打開。但實際上我用的時候打不開,只能點第二行的於公開網路上打開 webUI 的介面

raw-image

上圖中,各號碼的用途如下:

  1. 聲音模型 - 照理說會出現剛才 Step 2. 中提供之連結的模型。另外,如果想增加模型可以去左上方第二個分頁 Download Model 中操作,然後再回到 Inference 分頁點按 1 右邊的 Refresh
  2. 將稍早前拆分出來的歌聲拖曳至此以上傳 (Upload)
  3. 上傳成功後應該會出現在 3 的下拉式選單中,沒有的話點擊 3 右邊的 Refresh 試試看
  4. Convert,將 2/3 的歌聲轉換成聲音模型的歌聲。
  5. 轉檔成功後會出現在這裡,可點按右上角的 3個點小圖示下載(截圖中尚未出現)


祝大家 Cover 愉快!

avatar-img
82會員
104內容數
筆者探索各種感興趣事物的紀錄。 *副帳非主流政治沙龍《黑米BR不政確》:https://vocus.cc/salon/BRiceP
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
黑米BR的沙龍 的其他內容
因為最近 Vlad 頻繁出問題,且Img2Img算一張1024x2048、Denoising Strength 0.45 的圖要整整兩個小時,想說暫時先用 A1111 應急。沒想到 A1111 現在也是半斤八兩,沒有 --no-half --no-half-vae u 一定出問題不說,Img2Img
實作心得 | AI是畫家,使用者是責編 即使套用超強大的插件 ControlNet,在相當於從草稿→完稿的 Img2Img Upscale 過程中,仍時常會損失初始小圖想保留的特色,以及產生奇怪的部分,就好比畫家和責編,對需求的了解總會相隔一層薄霧的差距。 於是就需要花費大量的時間篩選,一張
高解析度寫實風 這是以大主題「婚紗」衍伸各種「人設」的嘗試。 心得①用於放上最滿意的成品。心得②將分享過程秘辛與趣事,以及未選為Amazon上架的相冊內容的圖片。
最近 Stability AI 的 SD-XL 即將完工。原先只有 ComfyUI 能支援,但最近注意到 Vlad 也有支援了,遂嘗試了一下。
因為想嘗試將真實照片中的人物姿態融入成品中,所以在Text2Image(文生圖)階段使用了三種ControlNet:Depth (景深)、reference_only (參照)、lightingBasedPicture_v10 (打光模型)。
這篇很短,僅提供在算圖時於VAE階段%卡死不動的可能解決方案。 方法:關掉Token Merge 祝大家算圖愉快!
因為最近 Vlad 頻繁出問題,且Img2Img算一張1024x2048、Denoising Strength 0.45 的圖要整整兩個小時,想說暫時先用 A1111 應急。沒想到 A1111 現在也是半斤八兩,沒有 --no-half --no-half-vae u 一定出問題不說,Img2Img
實作心得 | AI是畫家,使用者是責編 即使套用超強大的插件 ControlNet,在相當於從草稿→完稿的 Img2Img Upscale 過程中,仍時常會損失初始小圖想保留的特色,以及產生奇怪的部分,就好比畫家和責編,對需求的了解總會相隔一層薄霧的差距。 於是就需要花費大量的時間篩選,一張
高解析度寫實風 這是以大主題「婚紗」衍伸各種「人設」的嘗試。 心得①用於放上最滿意的成品。心得②將分享過程秘辛與趣事,以及未選為Amazon上架的相冊內容的圖片。
最近 Stability AI 的 SD-XL 即將完工。原先只有 ComfyUI 能支援,但最近注意到 Vlad 也有支援了,遂嘗試了一下。
因為想嘗試將真實照片中的人物姿態融入成品中,所以在Text2Image(文生圖)階段使用了三種ControlNet:Depth (景深)、reference_only (參照)、lightingBasedPicture_v10 (打光模型)。
這篇很短,僅提供在算圖時於VAE階段%卡死不動的可能解決方案。 方法:關掉Token Merge 祝大家算圖愉快!
你可能也想看
Google News 追蹤
Thumbnail
Free Online AI Vocal Remover & Isolator 是一個線上音訊分離工具,運用 AI 技術精準辨識人聲和樂器並自動消除噪音,輸出高品質清晰音訊。上傳音樂或影片即可獲得人聲和伴奏音樂,支援抓取社群影音檔案,提交連結可以免費下載高品質MP3。
Thumbnail
作者試唱ゴールデンボンバー的「女々しくて」的音檔,並提及了hololive的歌手以及其他知名的cover版本。後記介紹不同的風格和翻唱版本給讀者欣賞,並給予一些個人感想和評論。
Thumbnail
本文介紹HoloMyth的成員Gawr Gura的歌曲推薦和相關小動畫。Gura有許多受歡迎的未存檔歌回,網友們也將這些影片備份在YouTube上,作者推薦了Hololive Karaoke頻道以及一些有趣的HoloMyth小動畫。後記分享作者對HoloEn的感覺和期望。
Thumbnail
文章介紹了作者試唱Gawr Gura的《REFLECT》,並分享了翻唱經驗及挑戰。作者也提供了各種不同語言和風格的翻唱版本,如俄文和韓文版本、cosplay翻唱及台V洛可洛斯特的版本。最後推薦了Gura本人的3D Live演出Jazz版,並表達對Gura唱腔的喜愛。
Thumbnail
一直很想出一首單曲,覺得不是自己做的或自己唱的,感覺都差那麼點,但沒辦法,我只是愛唱歌,不會作曲、編曲,要出一首完全靠自己的單曲真的太難了。最近嘗試自己寫詞,用Suno AI協助編曲,效果真的很棒,雖然還是想自己唱,不過需要另外製作伴唱重新錄製,而且自己唱的還沒有AI好聽,或許之後可以用AI將聲音換
Thumbnail
EaseUS 免費線上去聲器,利用 AI 技術可以將任何歌曲分離為人聲和音樂。上傳音樂、影片檔案立即自動處理,支援輸入 YouTube 影片連結提取音訊。目前開放免費使用、無須註冊。
Thumbnail
這篇文章分享了作者試唱的日語歌曲《花に亡霊》的音檔,作為個人的備份。雖然唱腔輕柔,但作者覺得成果不甚滿意,僅當作紀錄。後記提到這首歌是動畫電影《想哭的我戴上了貓的面具》的主題曲,推薦觀眾欣賞。也分享了其他好聽的翻唱版本供讀者洗耳朵w。
不囉嗦,先看成果,這是用我的聲音翻唱 Andy Williams的 Speak softly love (原唱連結) 作法步驟如下: 準備好原唱的聲音檔。 可利用人聲/樂聲分離工具 vocal remover https://vocalremover.org/ (這是目前網上最好的免費分離工
Thumbnail
這篇文章描述了作者突然在學校錄音室錄製一首歌曲的過程,還花了些時間做了一個個人風格的MV。雖然上傳到YouTube後觀看數不高,但作者表示只是個人興趣的備份內容。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
Free Online AI Vocal Remover & Isolator 是一個線上音訊分離工具,運用 AI 技術精準辨識人聲和樂器並自動消除噪音,輸出高品質清晰音訊。上傳音樂或影片即可獲得人聲和伴奏音樂,支援抓取社群影音檔案,提交連結可以免費下載高品質MP3。
Thumbnail
作者試唱ゴールデンボンバー的「女々しくて」的音檔,並提及了hololive的歌手以及其他知名的cover版本。後記介紹不同的風格和翻唱版本給讀者欣賞,並給予一些個人感想和評論。
Thumbnail
本文介紹HoloMyth的成員Gawr Gura的歌曲推薦和相關小動畫。Gura有許多受歡迎的未存檔歌回,網友們也將這些影片備份在YouTube上,作者推薦了Hololive Karaoke頻道以及一些有趣的HoloMyth小動畫。後記分享作者對HoloEn的感覺和期望。
Thumbnail
文章介紹了作者試唱Gawr Gura的《REFLECT》,並分享了翻唱經驗及挑戰。作者也提供了各種不同語言和風格的翻唱版本,如俄文和韓文版本、cosplay翻唱及台V洛可洛斯特的版本。最後推薦了Gura本人的3D Live演出Jazz版,並表達對Gura唱腔的喜愛。
Thumbnail
一直很想出一首單曲,覺得不是自己做的或自己唱的,感覺都差那麼點,但沒辦法,我只是愛唱歌,不會作曲、編曲,要出一首完全靠自己的單曲真的太難了。最近嘗試自己寫詞,用Suno AI協助編曲,效果真的很棒,雖然還是想自己唱,不過需要另外製作伴唱重新錄製,而且自己唱的還沒有AI好聽,或許之後可以用AI將聲音換
Thumbnail
EaseUS 免費線上去聲器,利用 AI 技術可以將任何歌曲分離為人聲和音樂。上傳音樂、影片檔案立即自動處理,支援輸入 YouTube 影片連結提取音訊。目前開放免費使用、無須註冊。
Thumbnail
這篇文章分享了作者試唱的日語歌曲《花に亡霊》的音檔,作為個人的備份。雖然唱腔輕柔,但作者覺得成果不甚滿意,僅當作紀錄。後記提到這首歌是動畫電影《想哭的我戴上了貓的面具》的主題曲,推薦觀眾欣賞。也分享了其他好聽的翻唱版本供讀者洗耳朵w。
不囉嗦,先看成果,這是用我的聲音翻唱 Andy Williams的 Speak softly love (原唱連結) 作法步驟如下: 準備好原唱的聲音檔。 可利用人聲/樂聲分離工具 vocal remover https://vocalremover.org/ (這是目前網上最好的免費分離工
Thumbnail
這篇文章描述了作者突然在學校錄音室錄製一首歌曲的過程,還花了些時間做了一個個人風格的MV。雖然上傳到YouTube後觀看數不高,但作者表示只是個人興趣的備份內容。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。