讓 AI 模仿 Gura 唱強風大背頭 | AICover

更新 發佈閱讀 4 分鐘

成果| 直接放開頭

隱隱約約有點 Gura 聲音的味道,但還有很大的提升空間。

使用之聲音素材的相關音樂作者與 VTubers 之連結如下:

<強風大背頭>(強風オールバック)原曲作者 Yukopi 的 YouTube 頻道

「鯊鯊」Gawr Gura(hololive 所屬)的 YouTube 頻道

「菁櫻」 さくらみこ(hololive 所屬)的 YouTube 頻道


流程 | 我的第一次,稱不上是心得/教學

使用的 Google Colab 上的 webUI 介面,其作者的速成教學影片(英文):

頻道在這裡

總之先搞首歌曲的 mp3 或 wav 或 FLAC 檔案

辦法很多,請自己想辦法。

把歌聲和配樂拆成兩個聲音檔

最簡單暴力的方法就是上傳至 X-Minus 網站,讓其自動幫你拆。

但實際上我失敗了

但實際上我失敗了

但實際上 X-Minus 沒有成功幫我拆開,所以我是從 Git 下載了 Ultimate Vocal Remover GUI v5.5.1 安裝檔安裝該軟體:

Git 上的載點

Mediafire 上的載點 (Mirror)

安裝完後打開軟體介面如下:

raw-image

Select Input 是選擇想要拆開的音源檔案

Select Output 是想存檔的路徑

除了 GPU Conversion 是我額外勾選的選項外,其他的選項我全部使用預設值

點擊 Start Processing 就會開始拆分,靜等跑完即可。拆分出來的檔案(預設是 WAV 格式)標示 _(Vocals) 的是歌聲,_(Instrumental) 的是配樂。


準備訓練好的聲音 Cover 模型

這篇不談如何訓練,而是找現成的來用,我是從 Hugging Face 的 QuickWick 處下載的。

因為字母排序之故,Gura的需要點擊頁面底部的 Load more files 數次才會刷出來,然後下載。(如果知道直接搜尋找檔的方法,請務必留言教我,感謝!

下載來的聲音 cover 模型是 .zip 檔案,不用解壓縮。


把聲音模型上傳至 Google Drive

接著要把聲音模型上傳至 Google Drive,以供接著要使用的軟體程式存取。可能其他雲端檔案分享服務也可以,但我沒試過。請注意:如果是放在 Google Drive,該檔案的權限需要設定成只要有分享連結者都可以讀取


壓軸來了 - Easy GUI | 要來搞音樂啦

再來就是前往影片作者提供的 Google Colab webUI 了。

raw-image

別懷疑,打開全是文字幾乎看不到任何圖形介面的地方,沒有跑錯,因為這是安裝頁面。我對 Colab 完全不熟悉,所以我也不知道這是安裝到我的 Google 空間去了還是安裝到本地的哪個地方?

總而言之,流程基本上就是跑每一個步驟 (Step) 的程序,絕大多數就是點擊那個像是播放鍵的小圖示,Step 1. 的在這:

raw-image

點擊後圖示會變中間是方塊的:

raw-image

Step 1.  請等方塊跑完變回三角,就是安裝完成。如果安裝失敗基本上就是系統軟硬體(很可能需要 NVIDIA 的顯卡)不支援,我沒有辦法幫忙。


Step 2. 就是提供剛才上傳至雲端的聲音模型連結,然後按下圖左上的圖示:

raw-image

也是等到圖示從方塊變回三角形,且出現以下訊息時,即代表上傳成功:

raw-image

進入啟動軟體的 Step 3.

raw-image

也是在Step 3.項目下找同樣的三角圖示按

raw-image

這次圖示變方塊後再等一會,上圖顯示程式碼的下方會出現一些程式碼,包括:

raw-image

有用過 Stable Diffusion 的應該對第一行的網址很熟悉,意思是於本地打開。但實際上我用的時候打不開,只能點第二行的於公開網路上打開 webUI 的介面

raw-image

上圖中,各號碼的用途如下:

  1. 聲音模型 - 照理說會出現剛才 Step 2. 中提供之連結的模型。另外,如果想增加模型可以去左上方第二個分頁 Download Model 中操作,然後再回到 Inference 分頁點按 1 右邊的 Refresh
  2. 將稍早前拆分出來的歌聲拖曳至此以上傳 (Upload)
  3. 上傳成功後應該會出現在 3 的下拉式選單中,沒有的話點擊 3 右邊的 Refresh 試試看
  4. Convert,將 2/3 的歌聲轉換成聲音模型的歌聲。
  5. 轉檔成功後會出現在這裡,可點按右上角的 3個點小圖示下載(截圖中尚未出現)


祝大家 Cover 愉快!

留言
avatar-img
︾黑米BR的沙龍︽
82會員
106內容數
筆者探索各種感興趣事物的紀錄。 *副帳非主流政治沙龍《黑米BR不政確》:https://vocus.cc/user/@BRriceP
你可能也想看
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
「梵そよぎ(そよぎそよぎ)」是 梶裕貴 聲優活動 20 週年紀念企劃「そよぎフラクタル」的角色。這個企劃使用了梶裕貴自身的聲音作為基礎,開發出音頻合成軟件。公式利用了這個軟件,輸入歌詞、音高等,讓 梵そよぎ 翻唱不同的歌曲。這是一個 AI 音聲的企劃。
Thumbnail
「梵そよぎ(そよぎそよぎ)」是 梶裕貴 聲優活動 20 週年紀念企劃「そよぎフラクタル」的角色。這個企劃使用了梶裕貴自身的聲音作為基礎,開發出音頻合成軟件。公式利用了這個軟件,輸入歌詞、音高等,讓 梵そよぎ 翻唱不同的歌曲。這是一個 AI 音聲的企劃。
Thumbnail
就因為昨天做那款[下雪比心]太喜歡, 妞說沒有配音喔? 然後想到我買的YOUCUT,裡面有錄音, 就看了。嗯,只有五種聲音模式。 男人/女人/小孩/怪獸/外星人。 然後就迎來了我第一次的配音作品。 ———————————— 其實男女主的型大致上確定的差不多了.
Thumbnail
就因為昨天做那款[下雪比心]太喜歡, 妞說沒有配音喔? 然後想到我買的YOUCUT,裡面有錄音, 就看了。嗯,只有五種聲音模式。 男人/女人/小孩/怪獸/外星人。 然後就迎來了我第一次的配音作品。 ———————————— 其實男女主的型大致上確定的差不多了.
Thumbnail
渡過青年危機的其中一種方法,也許就是把教科書的所有都投進大海之中;你,就是自己的sensei。
Thumbnail
渡過青年危機的其中一種方法,也許就是把教科書的所有都投進大海之中;你,就是自己的sensei。
Thumbnail
音色安排幾乎相反,卻有各自的考量。本文將比較MARiA新翻唱的Shangri-La與原唱的唱法。並說說兩人所營造的效果有何不同。
Thumbnail
音色安排幾乎相反,卻有各自的考量。本文將比較MARiA新翻唱的Shangri-La與原唱的唱法。並說說兩人所營造的效果有何不同。
Thumbnail
筆者第一次嘗試 AI Cover 唱歌,僅是看了部 YouTube 簡易教學影片,所以稱不上是心得有成,但還是想分享給大家。
Thumbnail
筆者第一次嘗試 AI Cover 唱歌,僅是看了部 YouTube 簡易教學影片,所以稱不上是心得有成,但還是想分享給大家。
Thumbnail
假設我們有一段雙聲道的音檔, 正常來說透過whisper進行語音辨識時都是以整段音檔進行辨識,但我們若想將左右聲道分離進行辨識的話就得對音檔進行音訊處理了。 怎麼做呢? 比較簡單的方式就是透過音訊處理工具將音檔進行左右聲道的分離,再獨立的進行辨識即可。 這次會將雙聲道音檔透過pydub這套音訊處理工
Thumbnail
假設我們有一段雙聲道的音檔, 正常來說透過whisper進行語音辨識時都是以整段音檔進行辨識,但我們若想將左右聲道分離進行辨識的話就得對音檔進行音訊處理了。 怎麼做呢? 比較簡單的方式就是透過音訊處理工具將音檔進行左右聲道的分離,再獨立的進行辨識即可。 這次會將雙聲道音檔透過pydub這套音訊處理工
Thumbnail
歡迎來到[ボカロ作曲家介紹系列],這個系列會聊聊作曲家的歷程、曲風和我的感受,有什麼錯誤的地方也希望可以留個言讓我知道。
Thumbnail
歡迎來到[ボカロ作曲家介紹系列],這個系列會聊聊作曲家的歷程、曲風和我的感受,有什麼錯誤的地方也希望可以留個言讓我知道。
Thumbnail
唸書的時候把握機會,參加校內歌唱比賽,留了一個回憶給自己。 我的聲音頂多就順耳,談不上什麼特色,高中時參加過合唱團,但其實我的節奏感,很不行。 到了當天,心跳好快、聲音超抖, 舞台燈光打在身上,完全看不到台下聽眾。
Thumbnail
唸書的時候把握機會,參加校內歌唱比賽,留了一個回憶給自己。 我的聲音頂多就順耳,談不上什麼特色,高中時參加過合唱團,但其實我的節奏感,很不行。 到了當天,心跳好快、聲音超抖, 舞台燈光打在身上,完全看不到台下聽眾。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News